แรกเริ่มเดิมทีพี่วีร์ (@veer66) ได้ศึกษาเรื่องโปรแกรมตัดคำภาษาไทย เพื่อตัดประโยคให้เป็นคำย่อๆ มาตั้งแต่ปี พศ.2546 โดยใช้ภาษาซีในการประมวลผล (https://github.com/veer66/thaiwordseg)

หลังจากนั้น 11 ปีต่อมา พี่วีร์ได้พัฒนาโปรแกรมตัดคำจาก ภาษาซีเป็นภาษาจาวาสคิป (node.js)

 ซึ่งแม้การใช้ node.js จะต้องใช้บนฝั่งเซิฟเวอร์ แต่เราสามารถนำมาใช้ในฝั่ง client ได้ด้วยความช่วยเหลือของ browserify

นี่คือไฟล์ที่แปลงเสร็จแล้วครับ (https://github.com/pureexe/thai-wordcut-js)

สามารถเข้าไปโหลดไฟล์ wordcut.js มาใช้การได้เลยครับ
โดยวิธีการใช้งานหลังจากที่เราส่ง <script src> มาแล้วคือ

<script>
wordcut = require('wordcut');
wordcut.init();
out = wordcut.cut('กากา');
console.log(out);
</script>

เราจะเห็นผลลัพธ์ที่ออกมาคือ "กา|กา" นะครับ นี่คือคำที่ถูกแบ่งเรียบร้อยแล้ว

หรือท่านสามารถลองแบ่งคำได้จากบริเวณด้านล่างนี้ครับ


กำลังโหลด

อ้างอิง http://veer66.wordpress.com/2014/02/19/wordcut2014/
20 พฤศจิกายน 2557

คลังบทความ