
สรุปวิธีใช้ “Sora 2” AI ตัวโหด ตัวใหม่ของ OpenAI สร้างภาพและเสียง สมจริงมากขึ้น
1 ต.ค. 2025
ล่าสุด OpenAI เปิดตัว เครื่องมือ AI ตัวใหม่ ใช้สร้างวิดีโอพร้อมเสียงประกอบ ชื่อว่า “Sora 2”
พร้อมเปิดตัวแอปพลิเคชันเป็นคอมมิวนิตีสำหรับโพสต์วิดีโอที่สร้างขึ้นด้วย AI โดยเฉพาะ ในชื่อ “Sora” บนสมาร์ตโฟน iOS
หลายคนอาจจะรู้อยู่แล้วว่า Sora เป็น AI สร้างวิดีโอรุ่นแรกของ OpenAI ที่เริ่มปล่อยให้ใช้งานครั้งแรกเมื่อเดือนกุมภาพันธ์ ปี 2024 ที่ผ่านมา โดยทำงานด้วยโมเดล GPT‑1
แต่ Sora 2 ที่เพิ่งเปิดตัวนี้ ทำงานด้วยโมเดล GPT-3.5 หมายความว่า Sora 2 นี้ จะโหดกว่าเดิมหลายเท่า
แล้ว Sora 2 ทำอะไรได้บ้าง ? แล้วจะเข้าไปใช้งานได้อย่างไร ?
1. ความสามารถของ Sora 2
หลัก ๆ Sora 2 เป็น AI ที่ใช้ในการสร้างวิดีโอจากชุดคำสั่ง ซึ่งครั้งนี้ก็ได้รับการอัปเกรดให้เข้าใจโลกภายนอก และการเคลื่อนไหวของสิ่งต่าง ๆ ได้ดีขึ้นเยอะ
ยกตัวอย่างเช่น
- การเข้าใจบริบทท่าทางของมนุษย์ในรูปแบบต่าง ๆ โดยสามารถทำความเข้าใจได้ถึงระดับการขยับแบบยิมนาสติก การกระโดดตีลังกากลับหลัง
- การเข้าใจบริบทการกระทำในชีวิตจริงมากขึ้น เช่น การโยนลูกบอลลงห่วง สำหรับโมเดลก่อนหน้าหากลูกบอลไม่ลงห่วง ลูกบอลก็จะถูกบังคับให้ลงห่วงแบบผิดธรรมชาติ
พูดง่าย ๆ ก็คือ Sora 2 สามารถเข้าใจบริบทในการทำผิดพลาด หรือเข้าใจรูปแบบการเคลื่อนไหวจริง ๆ มากขึ้น
- เข้าใจบริบทในการสร้างเสียงได้ตรงตามฉากแต่ละฉาก
สมมติเช่น สร้างวิดีโอเล่นลูกบอล แน่นอนว่านอกจากจะมีเสียงลูกบอลแล้ว ก็ต้องมีเสียงผู้เล่นด้วย
สมมติเช่น สร้างวิดีโอเล่นลูกบอล แน่นอนว่านอกจากจะมีเสียงลูกบอลแล้ว ก็ต้องมีเสียงผู้เล่นด้วย
โดย Sora 2 จะสร้างเสียงบริบทการพูดของผู้เล่นให้โดยอัตโนมัติ หรือผู้ใช้งานจะพิมพ์ชุดคำสั่งให้ผู้เล่นแต่ละคนพูดคำต่าง ๆ กันก็ได้
- สามารถแทรกรูปภาพ หรือวิดีโอลงไป เพื่อให้ Sora 2 สร้างวิดีโอที่มีความใกล้เคียงกับของเดิมได้
2. วิธีการใช้งาน Sora 2
หลัก ๆ Sora 2 เปิดให้ใช้งานบนแอปพลิเคชัน Sora และเว็บไซต์ Sora
อย่างไรก็ตาม ตอนนี้ทั้งบนเว็บไซต์และแอปพลิเคชัน ยังเปิดให้ดาวน์โหลดแค่ในประเทศสหรัฐอเมริกา และแคนาดาเท่านั้น
เบื้องต้น Sora 2 จะเปิดให้ใช้งานฟรีในช่วงแรก และสำหรับผู้ใช้งาน ChatGPT Pro จะได้ใช้งานโมเดล
Sora 2 Pro ซึ่งเป็นโมเดลที่ฉลาดกว่าได้
Sora 2 Pro ซึ่งเป็นโมเดลที่ฉลาดกว่าได้
ส่วนประเทศไทย จะได้ใช้งาน Sora 2 เมื่อไร ก็ต้องรอติดตามกันต่อไป
3. แอปพลิเคชัน Sora
นอกจาก OpenAI จะเปิดตัว Sora 2 แล้ว ยังเปิดตัวแอปพลิเคชัน Sora เป็นคอมมิวนิตีคล้าย ๆ กับ TikTok และ Instagram ที่คอนเทนต์หลักในแอปพลิเคชันจะเป็นวิดีโอสั้นที่สร้างขึ้นจาก AI
ที่น่าสนใจ Sora ยังเป็นแอปพลิเคชันสำหรับใช้สร้างวิดีโอด้วย Sora 2 ด้วย
หลักการทำงานของ Sora คือ ให้ผู้ใช้อัปโหลดคลิปตัวเองหรือภาพตัวเองลงไป และเปลี่ยนแปลงให้เป็นวิดีโอที่ต้องการด้วยการพิมพ์ชุดคำสั่ง
ที่น่าสนใจคือ เราสามารถเลือกใช้หน้าเพื่อนให้มาอยู่ในคลิป AI ที่เราสร้างได้ ด้วยฟีเชอร์ “Cameos”
พูดง่าย ๆ ก็คือ เมื่อ A เอารูป B ไปสร้างวิดีโอ และเมื่อโพสต์ลงแอปพลิเคชันจะมีคำขึ้นว่า A Camoed B อีกด้วย
พูดง่าย ๆ ก็คือ เมื่อ A เอารูป B ไปสร้างวิดีโอ และเมื่อโพสต์ลงแอปพลิเคชันจะมีคำขึ้นว่า A Camoed B อีกด้วย
นอกจากนี้ผู้ใช้งานยังสามารถ Remix และร่วมกันสร้างสรรค์วิดีโอใหม่ ๆ กับเพื่อนได้อีกด้วย
4. เทียบความสามารถระหว่าง “Sora 2” จาก OpenAI กับ “Veo3” จาก Google
จากการทดลองสร้างวิดีโอประมาณ 2 คำสั่ง ด้วยการอิงคำสั่งจาก Sora 2 พบว่า
Sora 2 สามารถทำความเข้าใจเรื่องชุดคำสั่ง, บริบทการขยับของวัตถุ, เสียงที่ออกมาจากวัตถุ รวมถึงมุมมองแสง และเงา ได้ดีกว่า Veo3 อย่างเห็นได้ชัด
จากตัวอย่างในคอมเมนต์ จะเห็นได้ว่าคำสั่งแรกคือ “Standing on 2 horses” แต่ Veo3 ก็ยังให้คนขี่ม้าเพียงตัวเดียว แสดงว่า Veo3 ไม่เข้าใจบริบทของคำสั่งเท่าที่ควร
ต่อมาคือ วิดีโอกลุ่มคนเล่นวอลเลย์บอล
จะเห็นได้ว่า เครื่องมือ Veo3 ไม่สามารถเข้าใจบริบทการพูดของคนเล่นได้ ทำให้ได้ยินแค่เสียงบอลกระทบเท่านั้น
จะเห็นได้ว่า เครื่องมือ Veo3 ไม่สามารถเข้าใจบริบทการพูดของคนเล่นได้ ทำให้ได้ยินแค่เสียงบอลกระทบเท่านั้น
สรุปง่าย ๆ ก็คือ เครื่องมือ Sora 2 สามารถเข้าใจได้ทั้งบริบทการพูด และเสียงการกระทบของวัตถุในมุมต่าง ๆ ได้ดีกว่า Veo3 อย่างเห็นได้ชัด
แต่เครื่องมือ Sora 2 ก็ยังมีข้อผิดพลาด เช่น ไม่สามารถทดแทนบริบทในชีวิตจริงได้อย่างสมบูรณ์
ตัวอย่างเช่น การเคลื่อนไหวของใบไม้ที่ดูผิดปกติ, การขยับของวัตถุที่ดูมากเกินธรรมชาติ