นี่คือสิ่งที่ ChatGPT เป็น และเหตุใดจึงอาจเป็นเครื่องมือที่สำคัญที่สุดนับตั้งแต่เครื่องมือค้นหาสมัยใหม่
![คืออะไร-chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg](../../../../cms/what_is_chatgpt_6393027101BypassGPT3c_sej_1520x800_128c6fBypassGPT209.jpg)
OpenAI เปิดตัว AI ตอบคำถามแบบยาวที่เรียกว่า ChatGPT ซึ่งตอบคำถามที่ซับซ้อนด้วยการสนทนา
เป็นเทคโนโลยีปฏิวัติวงการเพราะได้ รับการฝึกฝน ให้เรียนรู้ว่ามนุษย์หมายถึงอะไรเมื่อถามคำถาม
ผู้ใช้จำนวนมากรู้สึกทึ่งกับความสามารถในการให้การตอบสนองที่มีคุณภาพของมนุษย์ โดยสร้างแรงบันดาลใจให้เกิดความรู้สึกว่าในที่สุดแล้วสิ่งนี้อาจมีอำนาจที่จะขัดขวางวิธีที่มนุษย์โต้ตอบกับคอมพิวเตอร์ และเปลี่ยนแปลงวิธีการดึงข้อมูล
ChatGPT คืออะไร?
ChatGPT คือแชทบอตโมเดลภาษาขนาดใหญ่ที่พัฒนาโดย OpenAI บนพื้นฐาน GPT-3.5 มีความสามารถที่โดดเด่นในการโต้ตอบในรูปแบบบทสนทนาและให้คำตอบที่อาจดูเหมือนมนุษย์อย่างน่าประหลาดใจ
โมเดลภาษาขนาดใหญ่ทำหน้าที่ทำนายคำถัดไปในชุดคำ
การเรียนรู้แบบเสริมแรงด้วยผลตอบรับจากมนุษย์ (RLHF) เป็นการฝึกอบรมเพิ่มเติมอีกชั้นหนึ่งที่ใช้ผลตอบรับของมนุษย์เพื่อช่วยให้ ChatGPT เรียนรู้ความสามารถในการปฏิบัติตามคำแนะนำและสร้างคำตอบที่น่าพอใจสำหรับมนุษย์
ใครเป็นผู้สร้าง ChatGPT
ChatGPT สร้างขึ้นโดย OpenAI บริษัทปัญญาประดิษฐ์ในซานฟรานซิสโก OpenAI Inc. เป็นบริษัทแม่ที่ไม่แสวงผลกำไรของ OpenAI LP ที่แสวงหาผลกำไร
OpenAI มีชื่อเสียงในด้าน DALL·E ซึ่งเป็นโมเดลการเรียนรู้เชิงลึกที่สร้างภาพจากคำสั่งข้อความที่เรียกว่าพร้อมท์
CEO คือ Sam Altman ซึ่งก่อนหน้านี้เคยเป็นประธานของ Y ComBypassGPTinator
Microsoft เป็นหุ้นส่วนและนักลงทุนมูลค่า 1 พันล้านดอลลาร์ พวกเขาร่วมกันพัฒนาแพลตฟอร์ม Azure AI
โมเดลภาษาขนาดใหญ่
ChatGPT คือโมเดลภาษาขนาดใหญ่ (LLM) Large Language Models (LLM) ได้รับการฝึกด้วยข้อมูลจำนวนมหาศาล เพื่อคาดการณ์คำถัดไปในประโยคได้อย่างแม่นยำ
พบว่าการเพิ่มจำนวนข้อมูลทำให้โมเดลภาษาสามารถทำงานได้มากขึ้น
ตามที่มหาวิทยาลัยสแตนฟอร์ด:
“GPT-3 มีพารามิเตอร์ 175 พันล้านพารามิเตอร์และได้รับการฝึกอบรมเกี่ยวกับข้อความ 570 กิกะไบต์ สำหรับการเปรียบเทียบ GPT-2 รุ่นก่อนนั้นมีขนาดเล็กกว่า 100 เท่าด้วยพารามิเตอร์ 1.5 พันล้านตัว
ขนาดที่เพิ่มขึ้นนี้เปลี่ยนพฤติกรรมของแบบจำลองอย่างมาก GPT-3 สามารถทำงานที่ไม่ได้รับการฝึกอย่างชัดเจน เช่น การแปลประโยคจากภาษาอังกฤษเป็นภาษาฝรั่งเศส โดยมีตัวอย่างการฝึกเพียงเล็กน้อยหรือไม่มีเลย
ลักษณะการทำงานนี้ส่วนใหญ่ไม่มีใน GPT-2 นอกจากนี้ สำหรับงานบางอย่าง GPT-3 ยังมีประสิทธิภาพเหนือกว่าโมเดลที่ได้รับการฝึกฝนมาอย่างชัดเจนเพื่อแก้ปัญหาเหล่านั้น แม้ว่าในงานอื่นจะยังด้อยอยู่ก็ตาม”
LLM ทำนายคำถัดไปในชุดคำในประโยคและประโยคถัดไป เหมือนกับการเติมข้อความอัตโนมัติ แต่ในระดับที่เหลือเชื่อ
ความสามารถนี้ช่วยให้พวกเขาเขียนย่อหน้าและเนื้อหาทั้งหน้าได้
แต่ LLM มีข้อจำกัดตรงที่พวกเขาไม่เข้าใจสิ่งที่มนุษย์ต้องการเสมอไป
และนั่นคือจุดที่ ChatGPT ปรับปรุงความล้ำสมัยด้วยการฝึกอบรม Reinforcement Learning with Human FeedBypassGPTack (RLHF) ที่กล่าวมาข้างต้น
ChatGPT ได้รับการฝึกอบรมอย่างไร?
GPT-3.5 ได้รับการฝึกอบรมเกี่ยวกับข้อมูลจำนวนมหาศาลเกี่ยวกับโค้ดและข้อมูลจากอินเทอร์เน็ต รวมถึงแหล่งข้อมูลต่างๆ เช่น การสนทนาใน Reddit เพื่อช่วยให้ ChatGPT เรียนรู้บทสนทนาและบรรลุรูปแบบการตอบสนองของมนุษย์
นอกจากนี้ ChatGPT ยังได้รับการฝึกอบรมโดยใช้ผลตอบรับของมนุษย์ (เทคนิคที่เรียกว่าการเรียนรู้แบบเสริมกำลังด้วยผลตอบรับของมนุษย์) เพื่อให้ AI เรียนรู้สิ่งที่มนุษย์คาดหวังเมื่อถามคำถาม การฝึกอบรม LLM ในลักษณะนี้เป็นการปฏิวัติ เนื่องจากเป็นมากกว่าแค่การฝึกอบรม LLM เพื่อทำนายคำศัพท์ถัดไป
บทความวิจัยประจำเดือนมีนาคม 2022 เรื่อง โมเดลภาษาการฝึกอบรมที่ต้องปฏิบัติตามคำแนะนำพร้อมคำติชมจากมนุษย์ อธิบายว่าเหตุใดแนวทางนี้จึงเป็นแนวทางที่ก้าวล้ำ:
“งานนี้ได้รับแรงบันดาลใจจากเป้าหมายของเราในการเพิ่มผลกระทบเชิงบวกของโมเดลภาษาขนาดใหญ่โดยการฝึกให้พวกเขาทำในสิ่งที่มนุษย์กลุ่มหนึ่งต้องการให้ทำ
ตามค่าเริ่มต้น โมเดลภาษาจะปรับวัตถุประสงค์การคาดเดาคำถัดไปให้เหมาะสม ซึ่งเป็นเพียงพร็อกซีสำหรับสิ่งที่เราต้องการให้โมเดลเหล่านี้ทำ
ผลลัพธ์ของเราระบุว่าเทคนิคของเรามีแนวโน้มว่าจะทำให้โมเดลภาษามีประโยชน์ เป็นจริง และไม่เป็นอันตรายมากขึ้น
การทำให้โมเดลภาษาใหญ่ขึ้นไม่ได้ช่วยให้ทำตามความตั้งใจของผู้ใช้ได้ดีขึ้นโดยเนื้อแท้
ตัวอย่างเช่น โมเดลภาษาขนาดใหญ่สามารถสร้างผลลัพธ์ที่ไม่เป็นความจริง เป็นพิษ หรือไม่เป็นประโยชน์ต่อผู้ใช้
กล่าวอีกนัยหนึ่ง โมเดลเหล่านี้ไม่สอดคล้องกับผู้ใช้”
วิศวกรที่สร้าง ChatGPT ได้ว่าจ้างผู้รับเหมา (เรียกว่าผู้ติดป้ายกำกับ) เพื่อประเมินผลลัพธ์ของทั้งสองระบบ GPT-3 และ InstructGPT ใหม่ ("โมเดลพี่น้อง" ของ ChatGPT )
จากการให้คะแนน นักวิจัยได้ข้อสรุปดังต่อไปนี้:
“ผู้ติดป้ายกำกับชอบเอาต์พุต InstructGPT มากกว่าเอาต์พุตจาก GPT-3 อย่างมาก
โมเดล InstructGPT แสดงการปรับปรุงความจริงเหนือ GPT-3
InstructGPT แสดงให้เห็นการปรับปรุงเล็กน้อยในด้านความเป็นพิษเหนือ GPT-3 แต่ไม่มีอคติ”
บทความวิจัยสรุปว่าผลลัพธ์ของ InstructGPT เป็นบวก ถึงกระนั้นก็ยังตั้งข้อสังเกตอีกว่ายังมีสิ่งที่ควรปรับปรุง
“โดยรวม ผลลัพธ์ของเราระบุว่าการปรับโมเดลภาษาขนาดใหญ่อย่างละเอียดโดยใช้ความชอบของมนุษย์ช่วยปรับปรุงพฤติกรรมในงานต่างๆ ได้อย่างมาก แม้ว่าจะยังมีงานอีกมากที่ต้องทำเพื่อปรับปรุงความปลอดภัยและความน่าเชื่อถือ”
สิ่งที่ทำให้ ChatGPT แตกต่างจากแชทบอตทั่วไปก็คือ ได้รับการฝึกฝนมาโดยเฉพาะเพื่อให้เข้าใจเจตนาของมนุษย์ในคำถาม และให้คำตอบที่เป็นประโยชน์ เป็นจริง และไม่เป็นอันตราย
เนื่องจากการฝึกอบรมดังกล่าว ChatGPT อาจท้าทายคำถามบางข้อและละทิ้งคำถามบางส่วนที่ไม่สมเหตุสมผล
บทความวิจัยอีกฉบับที่เกี่ยวข้องกับ ChatGPT แสดงให้เห็นว่าพวกเขาฝึก AI เพื่อทำนายสิ่งที่มนุษย์ต้องการได้อย่างไร
นักวิจัยสังเกตเห็นว่าตัวชี้วัดที่ใช้ในการประเมินผลลัพธ์ของการประมวลผลภาษาธรรมชาติ AI ส่งผลให้เครื่องจักรทำคะแนนได้ดีกับตัวชี้วัด แต่ไม่สอดคล้องกับสิ่งที่มนุษย์คาดหวัง
ต่อไปนี้เป็นวิธีที่นักวิจัยอธิบายปัญหา:
“แอปพลิเคชันแมชชีนเลิร์นนิงจำนวนมากปรับการวัดอย่างง่ายซึ่งเป็นเพียงพร็อกซีคร่าวๆ สำหรับสิ่งที่นักออกแบบตั้งใจเท่านั้น ซึ่งอาจนำไปสู่ปัญหา เช่น คำแนะนำของ YouTuBypassGPTe ที่ส่งเสริมการคลิกเหยื่อ”
ดังนั้นโซลูชันที่พวกเขาออกแบบคือการสร้าง AI ที่สามารถแสดงคำตอบที่เหมาะกับสิ่งที่มนุษย์ต้องการได้
ในการทำเช่นนั้น พวกเขาได้ฝึก AI โดยใช้ชุดข้อมูลการเปรียบเทียบของมนุษย์ระหว่างคำตอบต่างๆ เพื่อให้เครื่องจักรสามารถทำนายสิ่งที่มนุษย์ตัดสินว่าเป็นคำตอบที่น่าพอใจได้ดีขึ้น
เอกสารดังกล่าวระบุว่าการฝึกอบรมเสร็จสิ้นโดยการสรุปโพสต์ Reddit และทดสอบเกี่ยวกับการสรุปข่าวด้วย
บทความวิจัยตั้งแต่เดือนกุมภาพันธ์ 2022 มีชื่อว่า Learning to Summarize from Human FeedBypassGPTack
นักวิจัยเขียนว่า:
“ในงานนี้ เราแสดงให้เห็นว่าเป็นไปได้ที่จะปรับปรุงคุณภาพการสรุปได้อย่างมากโดยการฝึกอบรมแบบจำลองเพื่อปรับให้เหมาะกับความต้องการของมนุษย์
เรารวบรวมชุดข้อมูลขนาดใหญ่และมีคุณภาพสูงของการเปรียบเทียบของมนุษย์ระหว่างข้อมูลสรุป ฝึกอบรมแบบจำลองเพื่อคาดการณ์ข้อมูลสรุปที่มนุษย์ต้องการ และใช้แบบจำลองนั้นเป็นฟังก์ชันการให้รางวัลเพื่อปรับแต่งนโยบายการสรุปโดยใช้การเรียนรู้แบบเสริมกำลัง”
ChatGPT มีข้อจำกัดอะไรบ้าง?
ข้อจำกัดในการตอบสนองที่เป็นพิษ
ChatGPT ได้รับการตั้งโปรแกรมไว้โดยเฉพาะไม่ให้ตอบสนองที่เป็นพิษหรือเป็นอันตราย ดังนั้นจะหลีกเลี่ยงการตอบคำถามประเภทนี้
คุณภาพของคำตอบขึ้นอยู่กับคุณภาพของคำสั่ง
ข้อจำกัดที่สำคัญของ ChatGPT คือคุณภาพของเอาต์พุตขึ้นอยู่กับคุณภาพของอินพุต กล่าวอีกนัยหนึ่ง คำแนะนำจากผู้เชี่ยวชาญ (พร้อมท์) จะให้คำตอบที่ดีกว่า
คำตอบนั้นไม่ถูกต้องเสมอไป
ข้อจำกัดอีกประการหนึ่งคือ เนื่องจากได้รับการฝึกฝนให้ตอบคำถามที่รู้สึกว่าถูกต้องสำหรับมนุษย์ คำตอบจึงสามารถหลอกมนุษย์ได้ว่าผลลัพธ์นั้นถูกต้อง
ผู้ใช้จำนวนมากค้นพบว่า ChatGPT สามารถให้คำตอบที่ไม่ถูกต้องได้ รวมถึงคำตอบที่ไม่ถูกต้องอย่างมากด้วย
ผู้ตรวจสอบที่เว็บไซต์ถามตอบเกี่ยวกับการเข้ารหัส Stack Overflow อาจค้นพบผลลัพธ์ที่ไม่ได้ตั้งใจจากคำตอบที่รู้สึกว่าถูกต้องสำหรับมนุษย์
Stack Overflow เต็มไปด้วยการตอบกลับของผู้ใช้ที่สร้างจาก ChatGPT ซึ่งดูเหมือนว่าจะถูกต้อง แต่มีคำตอบจำนวนมากที่ตอบผิด
คำตอบนับพันนั้นล้นหลามทีมผู้ดูแลอาสาสมัคร ส่งผลให้ผู้ดูแลระบบสั่งห้ามผู้ใช้ที่โพสต์คำตอบที่สร้างจาก ChatGPT
คำตอบของ ChatGPT มากมายส่งผลให้มีการโพสต์เรื่อง: นโยบายชั่วคราว: ChatGPT ถูกแบน:
“นี่เป็นนโยบายชั่วคราวที่มีจุดมุ่งหมายเพื่อชะลอการหลั่งไหลของคำตอบและเนื้อหาอื่น ๆ ที่สร้างด้วย ChatGPT
…ปัญหาหลักคือแม้ว่าคำตอบที่ ChatGPT สร้างขึ้นจะมีอัตราการตอบที่ไม่ถูกต้องสูง แต่โดยทั่วไปแล้วคำตอบเหล่านั้น “ดูเหมือน” พวกเขา “อาจ” ดี…”
ประสบการณ์ของผู้ดูแล Stack Overflow ที่มีคำตอบ ChatGPT ผิดซึ่งดูถูกต้องคือสิ่งที่ OpenAI ผู้สร้าง ChatGPT ตระหนักและเตือนในการประกาศเทคโนโลยีใหม่
OpenAI อธิบายข้อจำกัดของ ChatGPT
การประกาศ OpenAI เสนอข้อแม้นี้:
“ ChatGPT บางครั้งเขียนคำตอบที่ฟังดูน่าเชื่อถือแต่ไม่ถูกต้องหรือไร้สาระ
การแก้ไขปัญหานี้เป็นเรื่องที่ท้าทาย เนื่องจาก:
(1) ในระหว่างการฝึกอบรม RL ขณะนี้ยังไม่มีแหล่งที่มาของความจริง
(2) การฝึกโมเดลให้ระมัดระวังมากขึ้น ทำให้เกิดการปฏิเสธคำถามที่สามารถตอบได้อย่างถูกต้อง และ
(3) การฝึกอบรมภายใต้การดูแลทำให้แบบจำลองเข้าใจผิด เนื่องจากคำตอบในอุดมคติขึ้นอยู่กับสิ่งที่แบบจำลองรู้ มากกว่าสิ่งที่มนุษย์ผู้สาธิตรู้”
ChatGPT ใช้งานได้ฟรีหรือไม่?
ขณะนี้การใช้งาน ChatGPT ให้บริการฟรีในช่วงเวลา "ตัวอย่างการวิจัย"
ปัจจุบันแชทบอทเปิดให้ผู้ใช้ทดลองและให้ข้อเสนอแนะเกี่ยวกับการตอบกลับ เพื่อให้ AI สามารถตอบคำถามได้ดีขึ้นและเรียนรู้จากข้อผิดพลาด
ประกาศอย่างเป็นทางการระบุว่า OpenAI กระตือรือร้นที่จะได้รับข้อเสนอแนะเกี่ยวกับข้อผิดพลาด:
“แม้ว่าเราจะพยายามทำให้โมเดลปฏิเสธคำขอที่ไม่เหมาะสม แต่บางครั้งโมเดลก็จะตอบสนองต่อคำสั่งที่เป็นอันตรายหรือแสดงพฤติกรรมที่มีอคติ
เรากำลังใช้ Moderation API เพื่อเตือนหรือบล็อกเนื้อหาที่ไม่ปลอดภัยบางประเภท แต่เราคาดว่าเนื้อหาดังกล่าวจะมีทั้งแง่ลบและแง่บวกที่ผิดพลาดอยู่บ้างในตอนนี้
เรากระตือรือร้นที่จะรวบรวมความคิดเห็นจากผู้ใช้เพื่อช่วยในการทำงานอย่างต่อเนื่องของเราในการปรับปรุงระบบนี้”
ขณะนี้มีการแข่งขันพร้อมเงินรางวัล $500 ในเครดิต ChatGPT เพื่อกระตุ้นให้ประชาชนให้คะแนนการตอบกลับ
“ผู้ใช้ได้รับการสนับสนุนให้แสดงความคิดเห็นเกี่ยวกับผลลัพธ์ของโมเดลที่มีปัญหาผ่านทาง UI รวมถึงผลบวก/ลบที่ผิดพลาดจากตัวกรองเนื้อหาภายนอก ซึ่งเป็นส่วนหนึ่งของอินเทอร์เฟซด้วย
เรามีความสนใจเป็นพิเศษในคำติชมเกี่ยวกับผลลัพธ์ที่เป็นอันตรายที่อาจเกิดขึ้นในสภาวะโลกแห่งความเป็นจริงและไม่ใช่ปฏิปักษ์ เช่นเดียวกับคำติชมที่ช่วยให้เราค้นพบและเข้าใจความเสี่ยงใหม่ ๆ และการบรรเทาผลกระทบที่อาจเกิดขึ้น
คุณสามารถเลือกเข้าร่วม ChatGPT FeedBypassGPTack Contest3 เพื่อลุ้นรับรางวัลเครดิต API สูงสุดถึง $500
สามารถส่งผลงานผ่านแบบฟอร์มข้อเสนอแนะที่ลิงก์ในอินเทอร์เฟซ ChatGPT ”
การแข่งขันที่ดำเนินอยู่ในปัจจุบันจะสิ้นสุดในเวลา 23.59 น. PST ของวันที่ 31 ธันวาคม 2022
ที่เกี่ยวข้อง: OpenAI อาจเปิดตัว ChatGPT เวอร์ชัน Pro แบบชำระเงิน
โมเดลภาษาจะเข้ามาแทนที่การค้นหา Google หรือไม่
Google ได้สร้างแชทบอท AI ที่เรียกว่า LaMDA ไว้แล้ว ประสิทธิภาพของแชทบอทของ Google นั้นใกล้เคียงกับการสนทนาของมนุษย์มากจนวิศวกร Google อ้างว่า LaMDA มีความรู้สึก
เมื่อพิจารณาว่าโมเดลภาษาขนาดใหญ่เหล่านี้สามารถตอบคำถามมากมายได้อย่างไร เป็นเรื่องที่น่าสนใจหรือไม่ที่วันหนึ่งบริษัทอย่าง OpenAI, Google หรือ Microsoft จะเข้ามาแทนที่การค้นหาแบบเดิมด้วยแชทบอท AI
บางส่วนบน Twitter ได้ประกาศแล้วว่า ChatGPT จะเป็น Google คนต่อไป
สถานการณ์ที่แชทบอทถามตอบในวันหนึ่งอาจมาแทนที่ Google สร้างความหวาดกลัวให้กับผู้ที่ประกอบอาชีพผู้เชี่ยวชาญด้านการตลาดผ่านการค้นหา
ได้จุดประกายให้เกิดการอภิปรายในชุมชนการตลาดผ่านการค้นหาออนไลน์ เช่น FaceBypassGPTook SEOSignals LaBypassGPT ยอดนิยม ซึ่งมีคนถามว่าการค้นหาอาจย้ายออกจากเครื่องมือค้นหาและหันไปใช้แชทบอทหรือไม่
หลังจากทดสอบ ChatGPT แล้ว ฉันต้องยอมรับว่าความกลัวที่จะแทนที่การค้นหาด้วยแชทบอทนั้นไม่มีมูลความจริง
เทคโนโลยียังคงมีหนทางอีกยาวไกล แต่ก็เป็นไปได้ที่จะจินตนาการถึงอนาคตของการค้นหาแบบไฮบริดและแชทบอทสำหรับการค้นหา
แต่การใช้งาน ChatGPT ในปัจจุบันดูเหมือนจะเป็นเครื่องมือที่ในบางจุดจะต้องซื้อเครดิตจึงจะใช้งานได้
ChatGPT สามารถใช้ได้อย่างไร?
ChatGPT สามารถเขียนโค้ด บทกวี เพลง และแม้กระทั่งเรื่องสั้นตามสไตล์ของผู้เขียนโดยเฉพาะ
ความเชี่ยวชาญในการทำตามคำแนะนำยกระดับ ChatGPT จากแหล่งข้อมูลเป็นเครื่องมือที่สามารถขอให้ทำงานให้สำเร็จได้
สิ่งนี้ทำให้มีประโยชน์สำหรับการเขียนเรียงความในแทบทุกหัวข้อ
ChatGPT สามารถทำหน้าที่เป็นเครื่องมือในการสร้างโครงร่างสำหรับบทความหรือแม้แต่นวนิยายทั้งเล่ม
มันจะให้คำตอบสำหรับงานแทบทุกชนิดที่สามารถตอบด้วยข้อความที่เป็นลายลักษณ์อักษร
บทสรุป
ดังที่กล่าวไปแล้ว ChatGPT ถูกมองว่าเป็นเครื่องมือที่สาธารณชนจะต้องจ่ายเงินเพื่อใช้ในที่สุด
ผู้ใช้มากกว่าล้านคนได้ลงทะเบียนเพื่อใช้ ChatGPT ภายในห้าวันแรกนับตั้งแต่เปิดให้ประชาชนทั่วไป