Google เปิดตัว AI เปลี่ยนข้อความให้กลายเป็นภาพเคลื่อนไหว สอน AI ด้วยภาพตัวอย่างนับล้าน

Google เปิดตัว AI เปลี่ยนข้อความให้กลายเป็นภาพเคลื่อนไหว สอน AI ด้วยภาพตัวอย่างนับล้าน

7 ต.ค. 2022
เมื่อไม่นานมานี้เราต่างตื่นเต้นกับเทคโนโลยีปัญญาประดิษฐ์ (AI) ที่สามารถสร้างสรรค์รูปภาพ จากการเขียนข้อความอธิบายสั้น ๆ โดยรูปภาพซึ่งเป็นตัวอย่างนับล้าน ที่ AI สามารถเรียนรู้ และจดจำได้
ในวันนี้ Google ก้าวไปอีกขั้น ด้วยการเปิดตัวเทคโนโลยี AI Text-to-Video ที่สามารถสร้างภาพเคลื่อนไหวแอนิเมชันสั้น ๆ จากข้อความที่มีความยาวเพียงไม่กี่คำ
Google อธิบายว่า เทคโนโลยี AI Tech-to-Video นี้ เกิดขึ้นได้ด้วยการฝึกให้ AI เรียนรู้ตัวอย่างการจับคู่ระหว่างรูปภาพ และคลิปวิดีโอ เข้ากับคำอธิบายสั้น ๆ รวมแล้วกว่า 74 ล้านคู่
เมื่อใส่ข้อความสั้น ๆ ที่เป็นเหมือนคำสั่งเข้าไป ระบบ AI จะประมวลผลคำสั่งนั้นให้กลายเป็นภาพเคลื่อนไหวขนาด 16 เฟรม ความละเอียดเพียง 24 x 48 พิกเซล
แล้วหลังจากนั้นระบบ AI จะปรับปรุงคุณภาพของภาพเคลื่อนไหวด้วยการคาดเดาเฟรมของภาพที่ต้องใช้เพิ่มเติม จนได้เป็นภาพเคลื่อนไหวที่มีขนาด 128 เฟรม ที่ความละเอียด HD 720p ซึ่งถือว่ามีคุณภาพที่ดีมากในระดับหนึ่งแล้ว
Google ยกตัวอย่างภาพเคลื่อนไหวที่ถูกสร้างขึ้นด้วย AI ว่ามีทั้ง ภาพเคลื่อนไหวของหมีแพนด้าที่กำลังเคี้ยวไม้ไผ่ หรือนักบินอวกาศที่กำลังขี่ม้า เป็นต้น
อย่างไรก็ตาม เมื่อเทคโนโลยี AI ถูกนำมาใช้ในการสังเคราะห์รูปภาพ หรือภาพเคลื่อนไหว ย่อมสร้างความกังวล โดยเฉพาะประเด็นด้านความเหมาะสม และศีลธรรมของรูปภาพ หรือภาพเคลื่อนไหวที่ถูกสร้างขึ้น
ในประเด็นนี้ Google ยืนยันว่า มีความพยายามในการคัดกรองคอนเทนต์ที่นำมาเป็นตัวอย่างให้กับ AI ทั้งในด้านเพศ ความรุนแรง การเหมารวม รวมถึงอคติทางสังคมต่าง ๆ
ซึ่งแม้ Google จะมีความพยายามที่จะคัดกรองคอนเทนต์ที่นำมาเป็นตัวอย่างให้ AI ในระดับหนึ่งแล้ว แต่ Google ก็ยังมีความกังวลว่าภาพเคลื่อนไหวที่ถูกสร้างขึ้นจาก AI อาจถูกใช้ในทางที่ไม่เหมาะสม
ดังนั้น Google จึงยังไม่ได้เปิดให้คนทั่วไปทดลองใช้ รวมถึงยังไม่ได้เปิดเผย Source Code ที่ใช้ในเทคโนโลยีนี้
นอกจากนี้ ความจริงแล้ว Google ไม่ใช่เจ้าแรก ที่เปิดตัวเทคโนโลยี AI ที่สามารถเปลี่ยนคำข้อความสั้น ๆ ให้กลายเป็นภาพเคลื่อนไหว
เพราะเมื่อสัปดาห์ที่แล้ว Meta บริษัทแม่ของ Facebook ก็เพิ่งจะเปิดตัวเทคโนโลยีในลักษณะเดียวกันนี้ไป ซึ่ง Mark Zuckerberg ก็ได้ให้ความเห็นไว้ด้วยว่า
“การสร้างภาพเคลื่อนไหวด้วย AI มีความยากกว่าการสร้างรูปภาพธรรมดา ๆ มาก เพราะไม่ใช่แค่การสร้างพิกเซลของรูปภาพ แต่ยังต้องคาดเดาด้วยว่าพิกเซลนั้นจะเปลี่ยนไปตามช่วงเวลาอย่างไร”
สำหรับใครที่ต้องการดูตัวอย่างภาพเคลื่อนไหวที่สร้างจาก AI Text-to-Video ของ Google สามารถเข้าไปดูเพิ่มเติมได้ที่ลิ้งก์นี้ https://imagen.research.google/video/

อ้างอิง :
© 2022 Marketthink. All rights reserved.