สรุป Claude โมเดลใหม่ “Opus 4.8” ไม่ตอบมั่ว เมื่อไม่รู้ ทำงานแทนคนได้ เก่งกว่าตัวเก่า

สรุป Claude โมเดลใหม่ “Opus 4.8” ไม่ตอบมั่ว เมื่อไม่รู้ ทำงานแทนคนได้ เก่งกว่าตัวเก่า

29 พ.ค. 2026
ล่าสุด Anthropic เพิ่งเปิดตัวโมเดลใหม่ของ Claude ชื่อว่า Opus 4.8 ที่อัปเกรดความสามารถเพิ่มจากโมเดลเก่าในหลายด้าน
แล้ว Opus 4.8 มีความสามารถที่น่าสนใจอย่างไร ? MarketThink สรุปให้อ่านในโพสต์นี้
1. Anthropic บอกว่า Opus 4.8 คือโมเดลที่ดีที่สุด และทรงพลังที่สุดของ Claude ในปัจจุบัน
ได้รับการพัฒนามาเพื่อการทำงานเป็น AI Agent ที่สามารถเป็นตัวแทนทำงานแทนมนุษย์ได้อย่างต่อเนื่อง มีความแม่นยำสูง เก่งเรื่องการใช้เหตุผลที่ซับซ้อน
และมีความซื่อสัตย์ในการตอบคำถาม ลดอาการหลอน ไม่ให้คำตอบแบบผิด ๆ ต่อไป
ซึ่งเรื่องนี้ Anthropic บอกว่า Opus 4.8 เป็นโมเดล AI ที่มีอาการหลอน (AI Hallucination) ลดลงเป็นอย่างมาก เมื่อเทียบกับโมเดลเดิม
ที่น่าสนใจคือ Opus 4.8 จะรู้ตัวและยอมรับเมื่อรู้สึกไม่แน่ใจ และจะแจ้งให้ผู้ใช้ทราบทันที และขอข้อมูลเพิ่มเติม แทนที่จะให้คำตอบด้วยการคาดเดา หรือให้ข้อมูลมั่ว ๆ
2. มีทักษะการเขียนโคดขั้นสูง (Agentic Coding)
มีความสามารถในการอ่านโคดเป็นจำนวนมาก สามารถจัดการโคดหลักแสนบรรทัดได้แบบอัตโนมัติ และสามารถสร้าง Sub-Agent คอยตรวจสอบและแก้ไขโคดที่มีจำนวนมหาศาล ไปพร้อมกันในครั้งเดียว
รวมถึงมี Context Window ที่ใหญ่ จึงสามารถทำความเข้าใจความสัมพันธ์ของโคด ที่อาจอยู่กระจัดกระจายกัน โดยไม่สับสน
ช่วยลดระยะเวลาการทำงานของนักพัฒนาที่ใช้ Claude ในการเขียนโคดไปได้มาก
3. อ่านเอกสารที่ทั้งยาว และซับซ้อนมาก ๆ ได้ดีขึ้น
นอกจากเรื่องการใช้งานในด้าน Agentic Coding แล้ว ยังเก่งเรื่องการอ่านเอกสารที่มีความยาวมาก และซับซ้อนสูงได้ดี เช่น
- การหาความเชื่อมโยงของข้อมูลที่อยู่คนละส่วนของเอกสาร หรือคนละไฟล์ได้อย่างแม่นยำ เช่น การหาข้อขัดแย้งในสัญญากฎหมายยาว ๆ หรือการสรุปประเด็นสำคัญจากรายงานการวิจัยหลายร้อยหน้า
- ดึงข้อมูลออกมาจากไฟล์เอกสารยาว ๆ ได้อย่างแม่นยำ แม้ว่าข้อมูลนั้นจะซ่อนอยู่ลึกมากก็ตาม
4. ผลการทดสอบประสิทธิภาพในด้านต่าง ๆ ของ Opus 4.8 เช่น
- GDPval (ใช้วัดความสามารถในการทำงานที่สร้างมูลค่าให้เศรษฐกิจจริง) 1,890 คะแนน สูงกว่า GPT-5.5 ที่ได้ 1,769 คะแนน และ Gemini 3.1 Pro ที่ได้ 1,314 คะแนน
- SWE-Bench Pro ที่ใช้ทดสอบความสามารถด้าน Agentic Coding ได้คะแนน 69.2%
- Humanity's Last Exam (การทดสอบคำถามหลากหลายด้านของมนุษย์กว่า 2,500 ข้อ) ได้คะแนน 49.8% และ 57.9%
5. นอกจากนี้ Anthropic ยังได้เปิดตัวความสามารถใหม่ ให้กับ Claude ด้วยเช่นกัน ได้แก่
- ตัวเลือก Effort Control
โดยให้ผู้ใช้งานเลือกได้ว่า จะให้ Claude ใช้ความพยายามมากเพียงใดในการตอบคำถาม ตั้งแต่ Low, Medium, High และ Max ขึ้นอยู่กับความซับซ้อนของงาน
ซึ่งความพยายามระดับ Low จะใช้ Token น้อยที่สุด เหมาะกับงานง่าย ๆ
และความพยายามระดับ Max จะใช้ Token มากที่สุด เหมาะกับงานที่ซับซ้อน ต้องคิดอย่างลึกซึ้ง
- ฟีเชอร์ Dynamic Workflows ของ Claude Code
ที่ทำให้ Claude สามารถสร้าง Sub-Agent หลายร้อยตัวขึ้นมา เพื่อทำงานไปพร้อมกันได้ ช่วยให้นักพัฒนาสามารถทำ Codebase Migrations ระดับแสนบรรทัดได้อัตโนมัติ
- Message API แบบใหม่
ที่นักพัฒนาสามารถส่งคำสั่งแทรกระหว่างการทำงานของ Claude ได้แล้ว โดยไม่จำเป็นต้องหยุดการทำงานก่อน ช่วยให้ประหยัดการใช้ Token ได้มากขึ้น
6. ตอนนี้ Opus 4.8 สามารถใช้งานได้แล้ว
เพียงแต่จำกัดการใช้งานสำหรับผู้ใช้งาน Claude แบบ Pro, Max, Team และ Enterprise เท่านั้น
ส่วนผู้ใช้งานแบบฟรี ตอนนี้จะยังมีตัวเลือกให้ใช้งานเพียงโมเดลเดิม
© 2026 Marketthink. All rights reserved. Privacy Policy.