มันคืออะไร & คุณสามารถใช้มันได้อย่างไร?

นี่คือสิ่งที่ ChatGPT เป็น และเหตุใดจึงอาจเป็นเครื่องมือที่สำคัญที่สุดนับตั้งแต่เครื่องมือค้นหาสมัยใหม่

คืออะไร-chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg

OpenAI เปิดตัว AI ตอบคำถามแบบยาวที่เรียกว่า ChatGPT ซึ่งตอบคำถามที่ซับซ้อนด้วยการสนทนา

เป็นเทคโนโลยีปฏิวัติวงการเพราะได้ รับการฝึกฝน ให้เรียนรู้ว่ามนุษย์หมายถึงอะไรเมื่อถามคำถาม

ผู้ใช้จำนวนมากรู้สึกทึ่งกับความสามารถในการให้การตอบสนองที่มีคุณภาพของมนุษย์ โดยสร้างแรงบันดาลใจให้เกิดความรู้สึกว่าในที่สุดแล้วสิ่งนี้อาจมีอำนาจที่จะขัดขวางวิธีที่มนุษย์โต้ตอบกับคอมพิวเตอร์ และเปลี่ยนแปลงวิธีการดึงข้อมูล

ChatGPT คืออะไร?

ChatGPT คือแชทบอตโมเดลภาษาขนาดใหญ่ที่พัฒนาโดย OpenAI บนพื้นฐาน GPT-3.5 มีความสามารถที่โดดเด่นในการโต้ตอบในรูปแบบบทสนทนาและให้คำตอบที่อาจดูเหมือนมนุษย์อย่างน่าประหลาดใจ

โมเดลภาษาขนาดใหญ่ทำหน้าที่ทำนายคำถัดไปในชุดคำ

การเรียนรู้แบบเสริมแรงด้วยผลตอบรับจากมนุษย์ (RLHF) เป็นการฝึกอบรมเพิ่มเติมอีกชั้นหนึ่งที่ใช้ผลตอบรับของมนุษย์เพื่อช่วยให้ ChatGPT เรียนรู้ความสามารถในการปฏิบัติตามคำแนะนำและสร้างคำตอบที่น่าพอใจสำหรับมนุษย์

ใครเป็นผู้สร้าง ChatGPT

ChatGPT สร้างขึ้นโดย OpenAI บริษัทปัญญาประดิษฐ์ในซานฟรานซิสโก OpenAI Inc. เป็นบริษัทแม่ที่ไม่แสวงผลกำไรของ OpenAI LP ที่แสวงหาผลกำไร

OpenAI มีชื่อเสียงในด้าน DALL·E ซึ่งเป็นโมเดลการเรียนรู้เชิงลึกที่สร้างภาพจากคำสั่งข้อความที่เรียกว่าพร้อมท์

CEO คือ Sam Altman ซึ่งก่อนหน้านี้เคยเป็นประธานของ Y ComBypassGPTinator

Microsoft เป็นหุ้นส่วนและนักลงทุนมูลค่า 1 พันล้านดอลลาร์ พวกเขาร่วมกันพัฒนาแพลตฟอร์ม Azure AI

โมเดลภาษาขนาดใหญ่

ChatGPT คือโมเดลภาษาขนาดใหญ่ (LLM) Large Language Models (LLM) ได้รับการฝึกด้วยข้อมูลจำนวนมหาศาล เพื่อคาดการณ์คำถัดไปในประโยคได้อย่างแม่นยำ

พบว่าการเพิ่มจำนวนข้อมูลทำให้โมเดลภาษาสามารถทำงานได้มากขึ้น

ตามที่มหาวิทยาลัยสแตนฟอร์ด:

“GPT-3 มีพารามิเตอร์ 175 พันล้านพารามิเตอร์และได้รับการฝึกอบรมเกี่ยวกับข้อความ 570 กิกะไบต์ สำหรับการเปรียบเทียบ GPT-2 รุ่นก่อนนั้นมีขนาดเล็กกว่า 100 เท่าด้วยพารามิเตอร์ 1.5 พันล้านตัว

ขนาดที่เพิ่มขึ้นนี้เปลี่ยนพฤติกรรมของแบบจำลองอย่างมาก GPT-3 สามารถทำงานที่ไม่ได้รับการฝึกอย่างชัดเจน เช่น การแปลประโยคจากภาษาอังกฤษเป็นภาษาฝรั่งเศส โดยมีตัวอย่างการฝึกเพียงเล็กน้อยหรือไม่มีเลย

ลักษณะการทำงานนี้ส่วนใหญ่ไม่มีใน GPT-2 นอกจากนี้ สำหรับงานบางอย่าง GPT-3 ยังมีประสิทธิภาพเหนือกว่าโมเดลที่ได้รับการฝึกฝนมาอย่างชัดเจนเพื่อแก้ปัญหาเหล่านั้น แม้ว่าในงานอื่นจะยังด้อยอยู่ก็ตาม”

LLM ทำนายคำถัดไปในชุดคำในประโยคและประโยคถัดไป เหมือนกับการเติมข้อความอัตโนมัติ แต่ในระดับที่เหลือเชื่อ

ความสามารถนี้ช่วยให้พวกเขาเขียนย่อหน้าและเนื้อหาทั้งหน้าได้

แต่ LLM มีข้อจำกัดตรงที่พวกเขาไม่เข้าใจสิ่งที่มนุษย์ต้องการเสมอไป

และนั่นคือจุดที่ ChatGPT ปรับปรุงความล้ำสมัยด้วยการฝึกอบรม Reinforcement Learning with Human FeedBypassGPTack (RLHF) ที่กล่าวมาข้างต้น

ChatGPT ได้รับการฝึกอบรมอย่างไร?

GPT-3.5 ได้รับการฝึกอบรมเกี่ยวกับข้อมูลจำนวนมหาศาลเกี่ยวกับโค้ดและข้อมูลจากอินเทอร์เน็ต รวมถึงแหล่งข้อมูลต่างๆ เช่น การสนทนาใน Reddit เพื่อช่วยให้ ChatGPT เรียนรู้บทสนทนาและบรรลุรูปแบบการตอบสนองของมนุษย์

นอกจากนี้ ChatGPT ยังได้รับการฝึกอบรมโดยใช้ผลตอบรับของมนุษย์ (เทคนิคที่เรียกว่าการเรียนรู้แบบเสริมกำลังด้วยผลตอบรับของมนุษย์) เพื่อให้ AI เรียนรู้สิ่งที่มนุษย์คาดหวังเมื่อถามคำถาม การฝึกอบรม LLM ในลักษณะนี้เป็นการปฏิวัติ เนื่องจากเป็นมากกว่าแค่การฝึกอบรม LLM เพื่อทำนายคำศัพท์ถัดไป

บทความวิจัยประจำเดือนมีนาคม 2022 เรื่อง โมเดลภาษาการฝึกอบรมที่ต้องปฏิบัติตามคำแนะนำพร้อมคำติชมจากมนุษย์ อธิบายว่าเหตุใดแนวทางนี้จึงเป็นแนวทางที่ก้าวล้ำ:

“งานนี้ได้รับแรงบันดาลใจจากเป้าหมายของเราในการเพิ่มผลกระทบเชิงบวกของโมเดลภาษาขนาดใหญ่โดยการฝึกให้พวกเขาทำในสิ่งที่มนุษย์กลุ่มหนึ่งต้องการให้ทำ

ตามค่าเริ่มต้น โมเดลภาษาจะปรับวัตถุประสงค์การคาดเดาคำถัดไปให้เหมาะสม ซึ่งเป็นเพียงพร็อกซีสำหรับสิ่งที่เราต้องการให้โมเดลเหล่านี้ทำ

ผลลัพธ์ของเราระบุว่าเทคนิคของเรามีแนวโน้มว่าจะทำให้โมเดลภาษามีประโยชน์ เป็นจริง และไม่เป็นอันตรายมากขึ้น

การทำให้โมเดลภาษาใหญ่ขึ้นไม่ได้ช่วยให้ทำตามความตั้งใจของผู้ใช้ได้ดีขึ้นโดยเนื้อแท้

ตัวอย่างเช่น โมเดลภาษาขนาดใหญ่สามารถสร้างผลลัพธ์ที่ไม่เป็นความจริง เป็นพิษ หรือไม่เป็นประโยชน์ต่อผู้ใช้

กล่าวอีกนัยหนึ่ง โมเดลเหล่านี้ไม่สอดคล้องกับผู้ใช้”

วิศวกรที่สร้าง ChatGPT ได้ว่าจ้างผู้รับเหมา (เรียกว่าผู้ติดป้ายกำกับ) เพื่อประเมินผลลัพธ์ของทั้งสองระบบ GPT-3 และ InstructGPT ใหม่ ("โมเดลพี่น้อง" ของ ChatGPT )

จากการให้คะแนน นักวิจัยได้ข้อสรุปดังต่อไปนี้:

“ผู้ติดป้ายกำกับชอบเอาต์พุต InstructGPT มากกว่าเอาต์พุตจาก GPT-3 อย่างมาก

โมเดล InstructGPT แสดงการปรับปรุงความจริงเหนือ GPT-3

InstructGPT แสดงให้เห็นการปรับปรุงเล็กน้อยในด้านความเป็นพิษเหนือ GPT-3 แต่ไม่มีอคติ”

บทความวิจัยสรุปว่าผลลัพธ์ของ InstructGPT เป็นบวก ถึงกระนั้นก็ยังตั้งข้อสังเกตอีกว่ายังมีสิ่งที่ควรปรับปรุง

“โดยรวม ผลลัพธ์ของเราระบุว่าการปรับโมเดลภาษาขนาดใหญ่อย่างละเอียดโดยใช้ความชอบของมนุษย์ช่วยปรับปรุงพฤติกรรมในงานต่างๆ ได้อย่างมาก แม้ว่าจะยังมีงานอีกมากที่ต้องทำเพื่อปรับปรุงความปลอดภัยและความน่าเชื่อถือ”

สิ่งที่ทำให้ ChatGPT แตกต่างจากแชทบอตทั่วไปก็คือ ได้รับการฝึกฝนมาโดยเฉพาะเพื่อให้เข้าใจเจตนาของมนุษย์ในคำถาม และให้คำตอบที่เป็นประโยชน์ เป็นจริง และไม่เป็นอันตราย

เนื่องจากการฝึกอบรมดังกล่าว ChatGPT อาจท้าทายคำถามบางข้อและละทิ้งคำถามบางส่วนที่ไม่สมเหตุสมผล

บทความวิจัยอีกฉบับที่เกี่ยวข้องกับ ChatGPT แสดงให้เห็นว่าพวกเขาฝึก AI เพื่อทำนายสิ่งที่มนุษย์ต้องการได้อย่างไร

นักวิจัยสังเกตเห็นว่าตัวชี้วัดที่ใช้ในการประเมินผลลัพธ์ของการประมวลผลภาษาธรรมชาติ AI ส่งผลให้เครื่องจักรทำคะแนนได้ดีกับตัวชี้วัด แต่ไม่สอดคล้องกับสิ่งที่มนุษย์คาดหวัง

ต่อไปนี้เป็นวิธีที่นักวิจัยอธิบายปัญหา:

“แอปพลิเคชันแมชชีนเลิร์นนิงจำนวนมากปรับการวัดอย่างง่ายซึ่งเป็นเพียงพร็อกซีคร่าวๆ สำหรับสิ่งที่นักออกแบบตั้งใจเท่านั้น ซึ่งอาจนำไปสู่ปัญหา เช่น คำแนะนำของ YouTuBypassGPTe ที่ส่งเสริมการคลิกเหยื่อ”

ดังนั้นโซลูชันที่พวกเขาออกแบบคือการสร้าง AI ที่สามารถแสดงคำตอบที่เหมาะกับสิ่งที่มนุษย์ต้องการได้

ในการทำเช่นนั้น พวกเขาได้ฝึก AI โดยใช้ชุดข้อมูลการเปรียบเทียบของมนุษย์ระหว่างคำตอบต่างๆ เพื่อให้เครื่องจักรสามารถทำนายสิ่งที่มนุษย์ตัดสินว่าเป็นคำตอบที่น่าพอใจได้ดีขึ้น

เอกสารดังกล่าวระบุว่าการฝึกอบรมเสร็จสิ้นโดยการสรุปโพสต์ Reddit และทดสอบเกี่ยวกับการสรุปข่าวด้วย

บทความวิจัยตั้งแต่เดือนกุมภาพันธ์ 2022 มีชื่อว่า Learning to Summarize from Human FeedBypassGPTack

นักวิจัยเขียนว่า:

“ในงานนี้ เราแสดงให้เห็นว่าเป็นไปได้ที่จะปรับปรุงคุณภาพการสรุปได้อย่างมากโดยการฝึกอบรมแบบจำลองเพื่อปรับให้เหมาะกับความต้องการของมนุษย์

เรารวบรวมชุดข้อมูลขนาดใหญ่และมีคุณภาพสูงของการเปรียบเทียบของมนุษย์ระหว่างข้อมูลสรุป ฝึกอบรมแบบจำลองเพื่อคาดการณ์ข้อมูลสรุปที่มนุษย์ต้องการ และใช้แบบจำลองนั้นเป็นฟังก์ชันการให้รางวัลเพื่อปรับแต่งนโยบายการสรุปโดยใช้การเรียนรู้แบบเสริมกำลัง”

ChatGPT มีข้อจำกัดอะไรบ้าง?

ข้อจำกัดในการตอบสนองที่เป็นพิษ

ChatGPT ได้รับการตั้งโปรแกรมไว้โดยเฉพาะไม่ให้ตอบสนองที่เป็นพิษหรือเป็นอันตราย ดังนั้นจะหลีกเลี่ยงการตอบคำถามประเภทนี้

คุณภาพของคำตอบขึ้นอยู่กับคุณภาพของคำสั่ง

ข้อจำกัดที่สำคัญของ ChatGPT คือคุณภาพของเอาต์พุตขึ้นอยู่กับคุณภาพของอินพุต กล่าวอีกนัยหนึ่ง คำแนะนำจากผู้เชี่ยวชาญ (พร้อมท์) จะให้คำตอบที่ดีกว่า

คำตอบนั้นไม่ถูกต้องเสมอไป

ข้อจำกัดอีกประการหนึ่งคือ เนื่องจากได้รับการฝึกฝนให้ตอบคำถามที่รู้สึกว่าถูกต้องสำหรับมนุษย์ คำตอบจึงสามารถหลอกมนุษย์ได้ว่าผลลัพธ์นั้นถูกต้อง

ผู้ใช้จำนวนมากค้นพบว่า ChatGPT สามารถให้คำตอบที่ไม่ถูกต้องได้ รวมถึงคำตอบที่ไม่ถูกต้องอย่างมากด้วย

ผู้ตรวจสอบที่เว็บไซต์ถามตอบเกี่ยวกับการเข้ารหัส Stack Overflow อาจค้นพบผลลัพธ์ที่ไม่ได้ตั้งใจจากคำตอบที่รู้สึกว่าถูกต้องสำหรับมนุษย์

Stack Overflow เต็มไปด้วยการตอบกลับของผู้ใช้ที่สร้างจาก ChatGPT ซึ่งดูเหมือนว่าจะถูกต้อง แต่มีคำตอบจำนวนมากที่ตอบผิด

คำตอบนับพันนั้นล้นหลามทีมผู้ดูแลอาสาสมัคร ส่งผลให้ผู้ดูแลระบบสั่งห้ามผู้ใช้ที่โพสต์คำตอบที่สร้างจาก ChatGPT

คำตอบของ ChatGPT มากมายส่งผลให้มีการโพสต์เรื่อง: นโยบายชั่วคราว: ChatGPT ถูกแบน:

“นี่เป็นนโยบายชั่วคราวที่มีจุดมุ่งหมายเพื่อชะลอการหลั่งไหลของคำตอบและเนื้อหาอื่น ๆ ที่สร้างด้วย ChatGPT

…ปัญหาหลักคือแม้ว่าคำตอบที่ ChatGPT สร้างขึ้นจะมีอัตราการตอบที่ไม่ถูกต้องสูง แต่โดยทั่วไปแล้วคำตอบเหล่านั้น “ดูเหมือน” พวกเขา “อาจ” ดี…”

ประสบการณ์ของผู้ดูแล Stack Overflow ที่มีคำตอบ ChatGPT ผิดซึ่งดูถูกต้องคือสิ่งที่ OpenAI ผู้สร้าง ChatGPT ตระหนักและเตือนในการประกาศเทคโนโลยีใหม่

OpenAI อธิบายข้อจำกัดของ ChatGPT

การประกาศ OpenAI เสนอข้อแม้นี้:

“ ChatGPT บางครั้งเขียนคำตอบที่ฟังดูน่าเชื่อถือแต่ไม่ถูกต้องหรือไร้สาระ

การแก้ไขปัญหานี้เป็นเรื่องที่ท้าทาย เนื่องจาก:

(1) ในระหว่างการฝึกอบรม RL ขณะนี้ยังไม่มีแหล่งที่มาของความจริง

(2) การฝึกโมเดลให้ระมัดระวังมากขึ้น ทำให้เกิดการปฏิเสธคำถามที่สามารถตอบได้อย่างถูกต้อง และ

(3) การฝึกอบรมภายใต้การดูแลทำให้แบบจำลองเข้าใจผิด เนื่องจากคำตอบในอุดมคติขึ้นอยู่กับสิ่งที่แบบจำลองรู้ มากกว่าสิ่งที่มนุษย์ผู้สาธิตรู้”

ChatGPT ใช้งานได้ฟรีหรือไม่?

ขณะนี้การใช้งาน ChatGPT ให้บริการฟรีในช่วงเวลา "ตัวอย่างการวิจัย"

ปัจจุบันแชทบอทเปิดให้ผู้ใช้ทดลองและให้ข้อเสนอแนะเกี่ยวกับการตอบกลับ เพื่อให้ AI สามารถตอบคำถามได้ดีขึ้นและเรียนรู้จากข้อผิดพลาด

ประกาศอย่างเป็นทางการระบุว่า OpenAI กระตือรือร้นที่จะได้รับข้อเสนอแนะเกี่ยวกับข้อผิดพลาด:

“แม้ว่าเราจะพยายามทำให้โมเดลปฏิเสธคำขอที่ไม่เหมาะสม แต่บางครั้งโมเดลก็จะตอบสนองต่อคำสั่งที่เป็นอันตรายหรือแสดงพฤติกรรมที่มีอคติ

เรากำลังใช้ Moderation API เพื่อเตือนหรือบล็อกเนื้อหาที่ไม่ปลอดภัยบางประเภท แต่เราคาดว่าเนื้อหาดังกล่าวจะมีทั้งแง่ลบและแง่บวกที่ผิดพลาดอยู่บ้างในตอนนี้

เรากระตือรือร้นที่จะรวบรวมความคิดเห็นจากผู้ใช้เพื่อช่วยในการทำงานอย่างต่อเนื่องของเราในการปรับปรุงระบบนี้”

ขณะนี้มีการแข่งขันพร้อมเงินรางวัล $500 ในเครดิต ChatGPT เพื่อกระตุ้นให้ประชาชนให้คะแนนการตอบกลับ

“ผู้ใช้ได้รับการสนับสนุนให้แสดงความคิดเห็นเกี่ยวกับผลลัพธ์ของโมเดลที่มีปัญหาผ่านทาง UI รวมถึงผลบวก/ลบที่ผิดพลาดจากตัวกรองเนื้อหาภายนอก ซึ่งเป็นส่วนหนึ่งของอินเทอร์เฟซด้วย

เรามีความสนใจเป็นพิเศษในคำติชมเกี่ยวกับผลลัพธ์ที่เป็นอันตรายที่อาจเกิดขึ้นในสภาวะโลกแห่งความเป็นจริงและไม่ใช่ปฏิปักษ์ เช่นเดียวกับคำติชมที่ช่วยให้เราค้นพบและเข้าใจความเสี่ยงใหม่ ๆ และการบรรเทาผลกระทบที่อาจเกิดขึ้น

คุณสามารถเลือกเข้าร่วม ChatGPT FeedBypassGPTack Contest3 เพื่อลุ้นรับรางวัลเครดิต API สูงสุดถึง $500

สามารถส่งผลงานผ่านแบบฟอร์มข้อเสนอแนะที่ลิงก์ในอินเทอร์เฟซ ChatGPT ”

การแข่งขันที่ดำเนินอยู่ในปัจจุบันจะสิ้นสุดในเวลา 23.59 น. PST ของวันที่ 31 ธันวาคม 2022

ที่เกี่ยวข้อง: OpenAI อาจเปิดตัว ChatGPT เวอร์ชัน Pro แบบชำระเงิน

โมเดลภาษาจะเข้ามาแทนที่การค้นหา Google หรือไม่

Google ได้สร้างแชทบอท AI ที่เรียกว่า LaMDA ไว้แล้ว ประสิทธิภาพของแชทบอทของ Google นั้นใกล้เคียงกับการสนทนาของมนุษย์มากจนวิศวกร Google อ้างว่า LaMDA มีความรู้สึก

เมื่อพิจารณาว่าโมเดลภาษาขนาดใหญ่เหล่านี้สามารถตอบคำถามมากมายได้อย่างไร เป็นเรื่องที่น่าสนใจหรือไม่ที่วันหนึ่งบริษัทอย่าง OpenAI, Google หรือ Microsoft จะเข้ามาแทนที่การค้นหาแบบเดิมด้วยแชทบอท AI

บางส่วนบน Twitter ได้ประกาศแล้วว่า ChatGPT จะเป็น Google คนต่อไป

สถานการณ์ที่แชทบอทถามตอบในวันหนึ่งอาจมาแทนที่ Google สร้างความหวาดกลัวให้กับผู้ที่ประกอบอาชีพผู้เชี่ยวชาญด้านการตลาดผ่านการค้นหา

ได้จุดประกายให้เกิดการอภิปรายในชุมชนการตลาดผ่านการค้นหาออนไลน์ เช่น FaceBypassGPTook SEOSignals LaBypassGPT ยอดนิยม ซึ่งมีคนถามว่าการค้นหาอาจย้ายออกจากเครื่องมือค้นหาและหันไปใช้แชทบอทหรือไม่

หลังจากทดสอบ ChatGPT แล้ว ฉันต้องยอมรับว่าความกลัวที่จะแทนที่การค้นหาด้วยแชทบอทนั้นไม่มีมูลความจริง

เทคโนโลยียังคงมีหนทางอีกยาวไกล แต่ก็เป็นไปได้ที่จะจินตนาการถึงอนาคตของการค้นหาแบบไฮบริดและแชทบอทสำหรับการค้นหา

แต่การใช้งาน ChatGPT ในปัจจุบันดูเหมือนจะเป็นเครื่องมือที่ในบางจุดจะต้องซื้อเครดิตจึงจะใช้งานได้

ChatGPT สามารถใช้ได้อย่างไร?

ChatGPT สามารถเขียนโค้ด บทกวี เพลง และแม้กระทั่งเรื่องสั้นตามสไตล์ของผู้เขียนโดยเฉพาะ

ความเชี่ยวชาญในการทำตามคำแนะนำยกระดับ ChatGPT จากแหล่งข้อมูลเป็นเครื่องมือที่สามารถขอให้ทำงานให้สำเร็จได้

สิ่งนี้ทำให้มีประโยชน์สำหรับการเขียนเรียงความในแทบทุกหัวข้อ

ChatGPT สามารถทำหน้าที่เป็นเครื่องมือในการสร้างโครงร่างสำหรับบทความหรือแม้แต่นวนิยายทั้งเล่ม

มันจะให้คำตอบสำหรับงานแทบทุกชนิดที่สามารถตอบด้วยข้อความที่เป็นลายลักษณ์อักษร

บทสรุป

ดังที่กล่าวไปแล้ว ChatGPT ถูกมองว่าเป็นเครื่องมือที่สาธารณชนจะต้องจ่ายเงินเพื่อใช้ในที่สุด

ผู้ใช้มากกว่าล้านคนได้ลงทะเบียนเพื่อใช้ ChatGPT ภายในห้าวันแรกนับตั้งแต่เปิดให้ประชาชนทั่วไป