Zero-Shot Learning มีประโยชน์อย่างไร?

การเรียนรู้แบบ Zero-Shot ช่วยให้ AI สามารถตอบตอบคำถามได้หลากหลายมากยิ่งขึ้น ยกตัวอย่างเช่น งานจำแนกประเภทข้อความรีวิวสินค้าว่าเป็นสินค้ากลุ่มคอมพิวเตอร์ เครื่องใช้สำนักงาน เครื่องจักร หากเป็น ML หรือ โมเดล Text Classification ปกติก็จะจำกัดอยู่แค่ 3 หมวดหมู่นี้เท่านั้นถ้าต้องการจะจำแนกให้ได้มากกว่าจำเป็นจะต้องฝึกสอนด้วยข้อมูลรีวิวสินค้าที่มี Label กำกับให้มากขึ้นโมเดลจึงจะจำแนกได้ แต่ถ้าเป็นโมเดลที่เรียนรู้ด้วยวิธี Zero Shot นั้นเราสามารถออกแบบโมเดลให้ครอบคลุมการจำแนกหลายหมวดหมู่ได้ตั้งแต่แรกโดยที่ข้อมูลเหล่านั้นไม่ต้อง Label ไว้ก่อน ซึ่งจะทำให้โมเดลของเราสามารถจำแนกการรีวิวสินค้าในหมวดหมู่่อื่น ๆ ได้ด้วยนั่นเอง (และประหยัดเวลากับต้นทุนที่จะต้องมาทำ Label ให้ชุดข้อมูลด้วย)

Zero-Shot Learning คืออะไร

เป็นเทคนิคการเรียนรู้ที่ใช้กับ Deep Learning โดยกำหนดปัญหาให้โมเดลพยายามแก้ในขั้นตอนการวัดผลโมเดล โมเดลจะต้องทำนายคลาสของข้อมูลที่ไม่เคยเห็นในขณะที่เทรน โดยทั่วไปแล้ววิธีการเรียนรู้แบบนี้จะต้องมีข้อมูลมาช่วยโมเดลในการเชื่อมโยงระหว่างข้อมูลที่โมเดลได้เรียนรู้แล้วโดยมี Label กำกับ และข้อมูลที่โมเดลยังไม่ได้เรียนรู้และไม่มี Label กำกับ สิ่งนี้เรียกว่า Auxiliary Information หรือก็คือข้อมูลบางส่วนที่สังเกตได้จากข้อมูลที่มี Label กำกับโดยผ่านการ Encoding (แปลงจากข้อมูลที่มนุษย์เข้าใจให้อยู่ในรูปแบบที่โมเดลเข้าใจ) แล้ว ยกตัวอย่างเช่น มีชุดรูปภาพของสัตว์ที่จะต้องจำแนกประเภทอยู่หนึ่งชุด โดยมาพร้อมกับข้อมูลเสริม (Auxiliary Information) คือคำอธิบายว่าสัตว์นั้น ๆ มีลักษณะอย่างไร ทีนี้พอโมเดลเรียนรู้ภาพม้า (Labeled Data) โมเดลก็จะรู้จักม้าตามปกติ และเมื่อเจอม้าลายโมเดลก็จะยังสามารถเชื่อมโยงได้ว่านี้คือม้าแต่มีลายเป็นต้น ส่วนใหญ่วิธีการนี้จะใช้ในงานด้าน Natural Language Processing, Computer Vision เพราะว่าข้อมูลที่ใช้กับงานพวกนี้ส่วนใหญ่แล้วต้องการข้อมูลจำนวนมหาศาล และการทำ Label ให้กับชุดข้อมูลอย่างถูกต้องนั้นจริง ๆ เป็นเรื่องยากมากต้องมีผู้เชี่ยวชาญเฉพาะทางเกี่ยวกับเรื่องนั้น ๆ จึงจะสามารถทำได้ แต่ถึงอย่างนั้นก็ยังต้องใช้เวลามากและยังอาจเกิดความผิดผลาดหรือ Bias ได้อีกอยู่ดี วิธีการ Zero Shot นี้จึงช่วยลดภาระงานในส่วนนี้ได้เป็นอย่างมาก

Zero-Shot Learning ข้อมูลที่ต้องใช้
และขั้นตอนการทำเบื้องต้น

ข้อมูลที่ต้องใช้มีดังนี้

  1. ชุดข้อมูลสำหรับเทรนโมเดลตามปกติที่มี Label กำกับ
  2. ชุดข้อมูลที่โมเดลยังไม่เคยเจอตอนเทรน
  3. ข้อมูลเสริมเพิ่มเติมสำหรับเชื่อมโยงระหว่างข้อมูลในข้อ 1 และ 2 (Auxiliary Information) ใช้เพื่อดูความสัมพันธ์และความเชื่อมโยงกันระหว่างคุณสมบัติของข้อมูล มักจะอยู่ในรูปแบบ Embeddings Vector

ขั้นตอนการเรียนรู้

  1. ฝึกสอนโมเดลแบบ Supervised Learning ตามปกติ ให้โมเดลเรียนรู้กับข้อมูลที่มี Label และสกัดเอาความรู้มาให้ได้มากที่สุด
  2. ขั้นตอนประเมินผลโมเดล (Inference Stage) องค์ความรู้ที่ได้ทั้งหมดจากตอนเทรนโมเดลจะถูกนำมาใช้เพื่อจำแนกข้อมูลตัวอย่างออกเป็นชุดคลาสใหม่ โดยส่งผ่านไปยังข้อมูลที่ไม่เคยเจอตอนเทรนบน High Dimensional Vector Space และคำนวณหาจุดรวมหรือค่าความคล้ายระหว่างข้อมูล

Conclusion

ประโยชน์ของการเรียนรู้แบบ Zero-Shot คือช่วยให้โมเดลสามารถแก้ปัญหาได้ครอบคลุมมากยิ่งขึ้น โดยอาศัยข้อมูลที่มีการทำ Label น้อยลง (ลดต้นทุนการทำชุดข้อมูล) เพราะว่า Auxiliary Information เป็นเพียงการอธิบายเพิ่มเติมเพื่อควบคุมการเรียนรู้ของโมเดลเท่านั้นไม่ใช่สิ่งที่ชี้ถูกชี้ผิดในการเรียนรู้ให้กับโมเดล

อ่านเพิ่มเติมเพื่อความเข้าใจโดยละเอียดได้ที่นี่

  • https://www.v7labs.com/blog/zero-shot-learning-guide
  • https://en.wikipedia.org/wiki/Zero-shot_learning
  • https://www.kdnuggets.com/2022/12/zeroshot-learning-explained.html
  • https://huggingface.co/tasks/zero-shot-classification
facebook_logos_PNG19751

SmartWatch – Facebook

อุปกรณ์ Smartwatch ของ Facebook นี้จะมาพร้อมกับฟีเจอร์การแจ้งเตือนด้านสุขภาพและการออกกำลังกาย ซึ่งจะใช้งานร่วมกับชุด Headset Oculus ได้
Forwebpic_3

Climate Change – Economic

Climate Change สร้างความเสียหายต่อรายได้ ในระดับเศรษฐกิจโลกได้อย่างไร? จากการศึกษาของ Potsdam Institute for Climate Impact Research (PIK) พวกเขาได้กล่าวว่า “ภูมิภาคส่วนใหญ่จะมีรายได้ลดลงอย่างมาก ซึ่งนั่นรวมถึง อเมริกาเหนือ และ ยุโรป โดยที่เอเชียใต้ และ แอฟริกาจะได้รับผลกระทบหนักที่สุด ซึ่งผลกระทบต่อด้านรายได้นี้มาจากผลกระทบด้านผลผลิตทางการเกษตร ผลผลิตจากภาคแรงงานหรือด้านโครงสร้างพื้นฐาน สิ่งเหล่านี้ล้วนแล้วเกี่ยวข้องกับการเติบโตของเศรษฐกิจ และมันมีสาเหตุมาจาก Climate Change” โดยการที่สภาพอากาศเกิดการเปลี่ยนแปลงนั้นหลัก ๆ แล้วส่งผลให้เกิดความเปลี่ยนแปลงของการเกิดฝน…
sharethemicincyber.max-1000×1000

ShareTheMicInCyber

#ShareTheMicInCyber เป้าหมายเพื่อขจัดอุปสรรค ในการมีส่วนร่วมกับ Security Community และส่งเสิรมให้หยุดการเหยียดสีผิวในระบบอย่างยั่งยืน Systemic Racism Is a Cybersecurity Threat “People have argued that if we address social and systemic issues separately, we will get the technology right.…

ติดตาม SUBBRAIN ได้ที่นี่

Categories: Data&IT