แชทกับ ChatGPT ของ OpenAI เวอร์ชันล่าสุดล้มเหลวในการตอบคำถาม

OpenAIs-ChatGPT.jpg

ผ่านไปเกือบ 6 เดือนแล้วตั้งแต่ ChatGPT ของ OpenAI เปิดตัว จริงๆ ธุรกิจได้เปิดตัว ChatGPT 4 เมื่อเร็วๆ นี้ ที่ทำให้เทคโนโลยีนี้ก้าวกระโดดไปถึงระดับใหม่ในโลก

ChatGPT เป็นโมเดลภาษาที่ขับเคลื่อนด้วย AI และได้รับการฝึกอบรมในหลายกิจกรรม เช่น การแปลภาษา สรุปข้อมูลและการตอบคำถาม ความสามารถที่โดดเด่นของโมเดลนี้ได้รับการสังสัยมากมาย และเป็นผลสำหรับผู้คนที่เริ่มสงสัยเรื่องโอกาสในการจ้างงานของพวกเขา

GPT-4 รุ่นการประมวลผลภาษาสามารถใช้สำหรับวิเคราะห์ข้อมูลปริมาณมากได้ ซึ่งหลังจากนั้นจะสามารถสร้างเนื้อหาขึ้นมาโดยอิงตามผลการวิเคราะห์ นอกจากนี้ เทคโนโลยีใหม่ยังสามารถวิเคราะห์ข้อความปริมาณมากเพื่อนำเสนอข้อมูลให้กับผู้บริโภคเกี่ยวกับจุดข้อมูลที่เฉพาะเจาะจง

ไม่มีข้อสงสัยว่าเทคโนโลยีจะอยู่ในหลักการในระยะยาว เป็นที่ชัดเจนว่าเทคโนโลยีช่วยผู้ใช้ในหลายๆ ด้าน ในโอกาสหลายๆ ครั้ง เทคโนโลยีได้แสดงศักยภาพในการทำทุกอย่าง ตั้งแต่เขียนสคริปต์ไปจนถึงการแก้ปัญหากระดาษคำถามที่ยากที่สุด ไม่มีอะไรที่ ChatGPT ไม่สามารถทำได้ แต่จริงๆ แล้วมีบางสิ่งที่ ChatGPT ยากกว่าบ้างด้วย

1. ChatGPT ที่ใช้ปัญญาประดิษฐ์ ถูกผลักดันกลับเมื่อไม่สามารถผ่านการสอบร่วมรับเข้าศึกษา (JEE) ที่ประเทศอินเดียที่น่าทึ่ง เป็นการสอบร่วมรับเข้าที่มีความยากและดึงดูดนักเรียนหลายพันคนทุกปีที่สนใจในการเข้าศึกษาในวิทยาลัยวิศวกรรมที่เป็นที่ประจักษ์ที่สุดในประเทศอินเดีย เป็นหนึ่งในการสอบทางคณิตศาสตร์ที่ยากที่สุดที่ประกอบด้วยแผนผังซับซ้อนและตัวเลขที่ซับซ้อน

นักเรียนที่สนใจเข้าศูนย์การศึกษาชั้นนำเช่น IITs และ NITs ต้องผ่านการสอบกลางศูนย์การเข้าศึกษาร่วมกันก่อน ตามรายงาน ChatGPT ให้ผลสอบ JEE Advanced ไม่ดี

ผลการประกอบความสามารถของ ChatGPT ในการทดสอบไม่ได้ดีเท่าที่คาดหวัง เนื่องจากสามารถแก้ไขคำถามทั้งหมดในชุดข้อสอบได้เพียง 11 ข้อเท่านั้น

2. โมเดล ChatGPT ได้รับความสำเร็จในอดีตจากการทดสอบบางส่วนที่มีความเป็นที่สำคัญและยากมาก น่าชื่นชมที่ ChatGPT พยายามและตอบคำถามทั้ง 200 คำต่างๆ ในการสอบคุณสมบัติและการเข้าศึกษาในวิทยาลัยแพทย์ (NEET) ซึ่งต้องการผู้สมัครตอบคำถามจำนวน 180 คำจากทั้งหมด 200 คำ

แม้ว่าเช็ทจีพีทีจะพยายามตอบคำถามทั้งหมด 200 ข้อ และผลลัพธ์ของประสิทธิภาพของมันคือ 359 จาก 800 โดยเฉพาะอย่างยิ่ง เช็ทจีพีทีดำเนินการได้ดีมากในส่วนของชีววิทยาในการทดสอบ NEET โดยแสดงความแม่นยำที่ดีกว่าในการตอบคำถามที่ถามในส่วนนั้น การดำเนินการของเช็ทจีพีทีในการทดสอบ NEET นำมาซึ่งความสามารถในการโดดเด่นในโดเมนอื่น ๆ ็น้อยขึ้นกับความเป็นจริงว่ามันไม่ผ่านงานสอบ JEE Advanced

การแพ้ที่ ChatGPT ประสบในการทดสอบ JEE Advanced นั้นแสดงให้เห็นถึงข้อจำกัดที่มีอยู่ในรูปแบบของแม้กระทั่งแบบจำลอง AI ที่ขั้นสูงที่สุด แม้ว่าปัญญาประดิษฐ์จะมีศักยภาพในการทำลายอุตสาหกรรมหลายอย่าง แต่ยังมีอนาคตยาวนานก่อนที่มันจะสามารถแข่งขันกับความเชี่ยวชาญของมนุษย์ในงานที่ยากลำบากได้

Chatbot ChatGPT ของ OpenAI ได้ล้มเหลวในการสอบแข่งขันอีกครั้งหนึ่ง

3. ChatGPT ทำการสอบคณะกรรมการบริหารสาธารณะสหรัฐ (UPSC) ตามคำขอของนิตยสาร Analytics India (AIM) UPSC exam ถือเป็นหนึ่งในการสอบแข่งขันที่ยากที่สุดในโลก มีผู้สมัครกว่า 10 แสนคนที่นั่งสอบ UPSC ทุกปี แต่เพียง 5% เท่านั้นที่สามารถสอบผ่านได้

AIM ให้ ChatGPT คำถาม 100 ข้อจาก UPSC Prelims 2022

ชาติศาสตร์ทำแย่ในการสอบ UPSC Prelims 2022 ได้คะแนนเพียง 54 จาก 100 ในข้อสอบ 1 (ชุด A) เมื่อคะแนนที่ต้องการคือ 87.54 นั่นแสดงให้เห็นว่า ChatGPT ไม่ผ่านการทดสอบ UPSC

คำถามเกี่ยวกับหัวข้อเฉพาะของวิทยาศาสตร์ทั่วไปของประเทศอินเดีย ประวัติศาสตร์ ภูมิศาสตร์ เศรษฐศาสตร์ นิเวศวิทยา และเหตุการณ์ปัจจุบัน แชทบอททำได้ดีกับคำถามเกี่ยวกับสถานที่และเศรษฐกิจ แต่ล้มเหลวอย่างถึงที่สุดเมื่อถูกถามเกี่ยวกับเหตุการณ์ประวัติศาสตร์ที่เกิดขึ้นก่อนปี พ.ศ. 2564

ความจริงที่ชุดข้อมูลของ ChatGPT ถึงเท่ากับปี 2021 อาจเป็นปัจจัยที่สำคัญในความไม่สามารถตอบคำถามทั้งหมดในการสอบของแอปพลิเคชัน AI ได้อย่างถูกต้อง

4. นอกจากนี้ ผลสอบ CLAT สำหรับ ChatGPT ก็อยู่ในเกณฑ์ที่ดีกว่าเช่นกัน ในระหว่างสอบ CLAT UG เครื่องมือ AI นี้สามารถแก้ไขคำถามอย่างถูกต้องได้เพียง 50.83 เปอร์เซ็นต์เท่านั้น แต่ ChatGPT จะไม่สามารถแก้ไขคำถามในหมวดหมู่เรื่องตรรกะและเรื่องจำนวนเป็นไปได้ อย่างไรก็ตาม มันก็ทำได้ดีมากในหมวดหมู่เรื่องภาษาอังกฤษและเรื่องเศรษฐสารปัจจุบัน แต่เมื่อเป็นคำถามที่เกี่ยวข้องกับแนวคิด แล้วเครื่องมือนี้ก็มีปัญหาอย่างมาก

วางจำหน่ายในพฤศจิกายน 2022, ChatGPT ได้รับความนิยมอย่างมากในสหรัฐอเมริกา เทคโนโลยีปัญญาประดิษฐ์นี้ได้ประสบความสำเร็จในการผ่านการสอบใบอนุญาตแพทย์ในสหรัฐอเมริกา (USMLE) และการสอบ MBA ต่างๆในสหรัฐอเมริกา นอกจากนี้ยังผ่านการสอบ Coding ของ Google สำหรับช่างวิศวกรระดับ 3 ได้ด้วยความสำเร็จ

นักสัตวแพทย์ทั่วไปต้องประหลาดใจเมื่อ ChatGPT สามารถวินิจฉัยโรคของสุนัขได้ถูกต้องและช่วยชีวิตสัตว์ได้

ประเทศหลายประเทศก็มีมุมมองที่ต่างกันในการดูเรื่องของ ChatGPT และพร้อมจะดำเนินการที่แข็งแรงกับนวัตกรรมใหม่นี้ ในไม่กี่ประเทศสำคัญ ประเภท ประเทศเยอรมนีและประเทศอิตาลีได้ระงับการใช้เทคโนโลยีดังกล่าว ประเภทพวกนี้อ้างว่า ChatGPT ของ OpenAI ขาดการป้องกันที่เพียงพอในการป้องกันไม่ให้เด็กน้อยได้รับความเสียหายจากเนื้อหาที่ไม่เหมาะสม เช่นระบบการตรวจสอบอายุ

อุลริช เคลเบอร์ คณะเจ้าหน้าที่คุ้มครองข้อมูลส่วนบุคคลของเยอรมันได้ทำการเตือนว่า Chat-GPT อาจถูกห้ามใช้ในเยอรมนีเนื่องจากข้อกังวลเกี่ยวกับความปลอดภัยของข้อมูลผู้ใช้งาน คล้ายกับสิ่งที่เกิดขึ้นในประเทศอิตาลี

โอ้ย เดาว่าเทคโนโลยีที่มีพลังงานจากปัญญาประดิษฐ์จะพึ่งพาการใช้งานของมันเป็นอย่างไรในอนาคต

ขอบคุณที่อ่าน! ติดตามบทความที่เป็นประโยชน์เพิ่มเติมได้เร็ว ๆ นี้!

บทความที่เกี่ยวข้อง

ดูเพิ่มเติม >>

ปลดล็อกพลังของ AI ด้วย HIX.AI!