Skip to content

PyThaiNLP/th-cv-sentences

Repository files navigation

th-cv-sentences

Thai sentences from Common Voice https://commonvoice.mozilla.org/sentence-collector/

You can get lastest rejected text or approved text from Common Voice api

Rejected sentences

ประโยคที่ถูกปฏิเสธ

  • rejected.txt - ประโยคที่ถูกปฏิเสธมาจาก Sentence Collector
  • get-typos.txt - ลบประโยคที่มีภาษาอังกฤษ อักษรละติ ตัวเลข ไม้มยก ออกจาก rejected.txt เพื่อกรองให้เหลือเฉพาะประโยคที่น่าจะถูกปฏิเสธเพราะมีสะกดผิด หรือผิดไวยากรณ์ หรืออ่านยาก

Generated sentences

  • get-fake-data.ipynb - สร้างข้อมูลชื่อคน (จาก Faker) และข้อความแสดงจำนวน (สุ่มและใช้ PyThaiNLP อ่านจำนวนเป็นข้อความ)

Data preparation

เตรียมชุดข้อมูล

  • stocks.txt - ข้อมูลชื่อบริษัทและกองทุนในตลาดหลักทรัพย์ เตรียมจาก get-stocks.ipynb

Releases

No releases published

Packages

No packages published
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy