วันพุธที่ 28 กันยายน พ.ศ. 2565

ชีวิตง่ายขึ้นกับ ReadMe โปรแกรมดีฝีมือคนไทย แปลงเอกสารและรูปภาพเป็นข้อความดิจิทัล

 อาจารย์คณะวิศวฯ จุฬาฯ นำเทคโนโลยี AI Deep Tech พัฒนาโปรแกรมสแกนเอกสารและรูปภาพเป็นข้อความ (OCR) อ่านภาษาไทยแม่นยำกว่า 90% UTC จุฬาฯ พร้อม spin-off สู่ตลาดในนามบริษัท Eikonnex AI จำกัด


หลายคนที่ทำงานด้านข้อมูลที่มีการใช้เอกสารกระดาษ เช่น การทำแบบสอบถาม งานวิจัย ฯลฯ คงจะรู้ดีว่างานยากและจำเจจริงๆ อยู่ที่ตอนได้รับกระดาษพร้อมคำตอบหรือข้อมูลกลับมาแล้ว ต้องมาพิมพ์ข้อความจากกระดาษทีละแผ่นๆ เพื่อจัดเก็บข้อมูลเป็นไฟล์ดิจิทัล เป็นงานที่ใช้เวลามาก แถมทำให้สายตาล้า ออฟฟิศซินโดรมถามหาอีกต่างหาก 

งานแบบนี้ สำหรับรองศาสตราจารย์ ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย สามารถทดแทนด้วยแนวคิดปัญญาประดิษฐ์ (AI: Artificial Intelligence) อาจารย์ธนารัตน์จึงนำทีมนิสิตปริญญาเอก ดร.ธนานพ กอบชัยสวัสดิ์ ร่วมพัฒนา “ReadMe” โปรแกรมประเภท OCR (Optical Character Recognition) เพื่อช่วยสแกนข้อความทั้งภาษาไทยและภาษาอังกฤษที่อยู่บนเอกสาร รูปภาพ หรือไฟล์วีดิโอ ให้ออกมาเป็นตัวหนังสือดิจิทัลได้ทันที research cluster

OCR คืออะไร

เทคโนโลยี OCR หรือ Optical Character Recognition คือ โปรแกรมที่ใช้สแกนตัวหนังสือจากภาพ หรือวีดิโอ ให้กลายเป็นตัวหนังสือแบบดิจิทัล เพื่อนำข้อมูลมาวิเคราะห์ผล พร้อมนำไปประยุกต์ใช้งานได้ทันที ซึ่งรูปภาพที่นำมาใช้สแกนนั้นเป็นได้ 2 ลักษณะ คือ รูปภาพทั่วไป (Scene text image) และรูปภาพที่เป็นเอกสาร (Document scanned image)

เทคโนโลยี OCR ประยุกต์ใช้ได้หลากหลายรูปแบบ เช่น การอ่านรหัสไปรษณีย์บนซองจดหมาย เพื่อคัดแยกซองจดหมายได้โดยอัตโนมัติ การอ่านหมายเลขบนแคร่รถไฟ เพื่อให้สามารถทราบตำแหน่งของตู้รถไฟว่าอยู่จุดไหนเวลาใดได้ทันที สามารถใช้กับกล้องติดหน้ารถยนต์เพื่อช่วยอ่านป้ายจราจรและป้ายบอกทาง หรือช่วยอ่านป้ายต่างๆ ให้ผู้มีสายตาเลือนราง เป็นต้น

“OCR ถือเป็นนวัตกรรมที่ใช้ปัญญาประดิษฐ์ช่วยลดการใช้แรงงานมนุษย์ ประหยัดเวลา ทำให้ชีวิตประจำวันของคนเรามีความสะดวกและง่ายขึ้นมากเลยทีเดียว” รศ.ดร.ธนารัตน์ กล่าว


ReadMe อ่านไทยคล่องแบบเจ้าของภาษา

เทคโนโลยี OCR ได้รับการพัฒนามาอย่างต่อเนื่องจนมีความแม่นยำสูงขึ้นกว่าก่อนมาก แต่ก็ยังคงมีจุดอ่อนที่เป็นอุปสรรคต่อการใช้งานสำหรับคนไทย ซึ่งก็คือการอ่าน “ภาษาไทย” นั่นเอง

“ไวยากรณ์และโครงสร้างของภาษาอังกฤษจะง่ายต่อคอมพิวเตอร์ในการอ่าน แต่ภาษาไทยยากกว่ามาก เพราะตัวอักขระเยอะ มีสระ มีวรรณยุกต์ ในหนึ่งบรรทัดมีตัวอักษรได้ถึง 4 ระดับ ในขณะที่ภาษาอังกฤษมีเพียงระดับเดียว” รศ.ดร.ธนารัตน์ อธิบาย

แต่ปัญหาดังกล่าวกลายเป็นอดีตไปแล้ว เมื่อเทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) เข้ามามีบทบาทช่วยให้ AI ฉลาดมากขึ้น

“เมื่อนำเทคโนโลยีใหม่มารวมกับโจทย์เดิม ก็ช่วยเพิ่มความแม่นยำให้เทคโนโลยี OCR อ่านภาษาไทยได้เก่งเหมือนมีคนไทยมาอ่านเอง”


Read Me ช่วยเบาแรงในภาคธุรกิจ

ReadMe เป็นผลิตภัณฑ์ชิ้นแรกของบริษัท Eikonnex AI จำกัด ภายใต้การสนับสนุนจากศูนย์วิจัยและพัฒนาเทคโนโลยีเพื่ออุตสาหกรรม จุฬาลงกรณ์มหาวิทยาลัย (Chula UTC) ที่ รศ.ดร.ธนารัตน์ และทีม พัฒนาขึ้นหลังจากสำรวจปัญหาในภาคธุรกิจ

“งานของภาคธุรกิจส่วนใหญ่เป็นงานเอกสาร ซึ่งปัจจุบันยังใช้คนในการกรอกข้อมูลอยู่ เสียแรงและเวลามาก เราจึงพัฒนาโปรแกรม ReadMe เพื่อตอบโจทย์ธุรกิจ โดยเน้นที่การอ่านเอกสารให้แม่นยำ และเกิดข้อผิดพลาดให้น้อยที่สุด”  รศ.ดร.ธนารัตน์ กล่าวและยกตัวอย่างการประยุกต์ใช้ ReadMe ในสายงานธนาคาร

“องค์กรที่นำ ReadMe ไปใช้ในระบบแล้ว พบว่า เมื่อเทียบกับ OCR ของบริษัทอื่นๆ ทั้งของไทยและต่างประเทศ ReadMe มีความแม่นยำมากที่สุดถึง 92.6% ช่วยลดความผิดพลาดของมนุษย์ได้มาก (human error)”

ปัจจุบัน บริษัท Eikonnex AI จำกัด ให้บริการ ReadMe ทั้งในรูปแบบของการเข้าไปช่วยพัฒนาโปรแกรมหรือแอปพลิเคชัน (Software development) เพื่อธุรกิจนั้นๆ หรือต้องการซื้อตัวโปรแกรม (Licensing) ไปใช้กับแอปพลิเคชันขององค์กรเองก็สามารถทำได้เช่นกัน



ไม่มีความคิดเห็น:

แสดงความคิดเห็น

โกดังให้เช่า หลายขนาด หลากทำเล กรุงเทพฯปริมณฑล และ พื้นที่ EEC

  โกดังให้เช่า Happy Real Estate จัดตั้งขึ้นโดย บริษัท มีสุข คอร์ปอเรชั่น 2006 จำกัด โดย คุณเฉลิม ทองสุข ซึ่งเป็นวิศวกรโยธา ที่มีความรู้ความ...