![ภาพหน้าจอ-2023-03-14-เวลา-1-13-41-หลังเที่ยง.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_13_41_pm_da5958b43b.jpg)
ความสามารถขั้นสูงของ ChatGPT เช่นการทำการ debug โค้ด เขียนเรื่องสอนเขียนเรียงเรื่องหรือการทำตลก ได้นำไปสู่ความนิยมอย่างกว้างขวาง แต่ผู้ช่วยของมันเฉพาะด้านข้อความเท่านั้น- แต่ว่าจะมีการเปลี่ยนแปลง
ในวันอังคารที่ผ่านมา OpenAI เปิดเผย GPT-4, โมเดลที่มีหลายโหมดซึ่งรองรับการป้อนข้อมูลทั้งข้อความและภาพและส่งออกเป็นข้อความ
อีกสิ่งหนึ่ง: วิธีการทำให้ ChatGPT ให้ข้อมูลแหล่งอ้างอิงและการอ้างอิง
ความแตกต่างระหว่าง GPT-3.5 และ GPT-4 จะเป็น "ละเอียด" ในการสนทนาประจำวันเชิงไม่เป็นทางการ อย่างไรก็ตามโมเดลใหม่จะมีความสามารถมากกว่าเดิมในเรื่องความน่าเชื่อถือ ความคิดสร้างสรรค์ และความฉลาด
ตามข้อมูลจาก OpenAI, GPT-4 ได้คะแนนอยู่ในอันดับ 10% สูงสุดในการสอบแถบที่จำลอง ในขณะที่ GPT-3.5 ได้คะแนนอยู่ในอันดับต่ำสุด 10% และพบว่า GPT-4 ยังมีผลสอบดีกว่า GPT-3.5 ในชุดของการทดสอบเบนช์มาร์กตามที่แสดงได้ในกราฟด้านล่าง
![ภาพหน้าจอ-2566-03-14-เวลา-1-40-32-หลังเที่ยง.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_40_32_pm_c7577ae6e4.jpg)
สำหรับบริบทนั้น ChatGPT ทำงานบนโมเดลภาษาที่ปรับแต่งจากโมเดลในซีรี่ส์ 3.5 ซึ่งจำกัดการให้ผลลัพธ์ข้อความเท่านั้นสำหรับแชทบอท
การประกาศเกี่ยวกับ GPT-4 ของ OpenAI ตามมาหลังจากการแถลงข่าวของ Andreas Braun, ประธานเจ้าหน้าที่ด้านเทคโนโลยีสารสนเทศของ Microsoft เยอรมนี เมื่อสัปดาห์ที่แล้ว โดยเขากล่าวว่า GPT-4 จะมาในเร็ว ๆ นี้และจะเป็นเครื่องมือที่ทำให้เป็นไปได้ที่จะสร้างวิดีโอจากข้อความ
อีกทั้ง: ChatGPT ทำงานอย่างไร?
"ในสัปดาห์หน้าเราจะเปิดเผย GPT-4; ที่นั่นเราจะมีโมเดลโมเดลทางการสื่อสารหลายรูปแบบซึ่งจะนำเสนอโอกาสที่แตกต่างกันอย่างสิ้นเชิง - ตัวอย่างเช่นวิดีโอ," บาวน์ได้กล่าวตามที่เฮิร์ส เมื่อเข้าร่วมกิจกรรมในหนึ่งประชุมข่าวตามที่ Heise, สื่อข่าวเยอรมัน
แม้ว่า GPT-4 จะเป็นโมเดลที่รองรับหลายโหมด การอ้างถึงการสร้างวิดีโอจากข้อความยังคงไม่ถูกต้องมากนัก แต่โมเดลสามารถรับข้อมูลทางด้านภาพได้ ซึ่งเป็นการเปลี่ยนแปลงที่สำคัญจากโมเดลก่อนหน้านี้
หนึ่งในตัวอย่างที่ OpenAI ได้ให้แสดงเพื่อแสดงให้เห็นถึงความสามารถนี้คือ ChatGPT สแกนภาพเพื่อพยายามค้นหาว่าภาพที่ตัวผู้ใช้ป้อนเข้ามามีเรื่องตลกอยู่ที่ไหน
![ภาพหน้าจอ-2023-03-14-ตอนที่-1-36-02-หลังเที่ยง](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_36_02_pm_af3a113b01.jpg)
ตัวอย่างอื่น ๆ ได้แก่การอัปโหลดภาพกราฟและขอให้ GPT-4 ทำการคำนวณจากภาพนั้น หรืออัปโหลดแผ่นงานและขอให้มันแก้ปัญหาให้
เพิ่มเติมเรื่อง: 5 วิธีที่ ChatGPT สามารถช่วยคุณเขียนเรียงความได้
OpenAI กล่าวว่าจะเปิดตัวความสามารถในการป้อนข้อความของ GPT-4 ผ่าน ChatGPT และ API ผ่านรายการรอคอย คุณจะต้องรออีกสักครู่สำหรับความสามารถในการป้อนภาพ เนื่องจาก OpenAI กำลังร่วมมือกับพาร์ทเนอร์เดียวเพื่อเริ่มต้นด้านนั้น
ถ้าคุณผิดหวังเกี่ยวกับการไม่มีเครื่องมือสร้างวิดีโอจากข้อความ, ไม่ต้องกังวล เพราะว่านั่นไม่ใช่คอนเซ็ปต์ใหม่สำหรับเทคโนโลยีชั้นนำอย่าง Meta และ Google ทั้งสองซึ่งพัฒนาโมเดลที่ทำงานอยู่อย่าง Meta Make-A-Video และ Google Imagen Video ทั้งคู่ใช้ปัญญาประดิษฐ์ในการสร้างวิดีโอจากข้อมูลที่ผู้ใช้ให้มา