ChatGPT ทำงานอย่างไร

ChatGPT เป็นหนึ่งในเครื่องมือที่ขับเคลื่อนด้วย AI ที่มีความแวววาวที่สุด แต่จริงๆ แล้วอัลกอริทึมที่ทำงานอยู่เบื้องหลังได้ขับเคลื่อนแอปและบริการทั้งหมดตั้งแต่ปี 2020 ดังนั้นเพื่อให้เข้าใจวิธีการทำงานของ ChatGPT เราต้องเริ่มต้นด้วยการพูดถึงภาษาพื้นฐาน เครื่องยนต์ที่ขับเคลื่อนมัน

GPT ใน ChatGPT ส่วนใหญ่เป็น GPT-3 หรือ Generative Pre-trained Transformer 3 แม้ว่าขณะนี้ GPT-4 จะพร้อมใช้งานสำหรับสมาชิก ChatGPT Plus และอาจจะแพร่หลายมากขึ้นในเร็วๆ นี้ โมเดล GPT ได้รับการพัฒนาโดย OpenAI (บริษัทที่อยู่เบื้องหลัง ChatGPT และโปรแกรมสร้างภาพ DALL·E 2) แต่พวกมันขับเคลื่อนทุกอย่างตั้งแต่ฟีเจอร์ AI ของ Bing ไปจนถึงเครื่องมือเขียนอย่าง Jasper และ Copy.ai ในความเป็นจริง ตัวสร้างข้อความ AI ส่วนใหญ่ที่มีอยู่ในขณะนี้ใช้ GPT-3 และมีแนวโน้มที่จะเสนอ GPT-4 เป็นขั้นตอนต่อไป

ChatGPT ทำให้ GPT-3 เป็นจุดสนใจเพราะทำให้กระบวนการโต้ตอบกับโปรแกรมสร้างข้อความ AI เป็นเรื่องง่าย และที่สำคัญที่สุดคือ ฟรีสำหรับทุกคน นอกจากนี้ยังเป็นแชทบอท และผู้คนต่างก็ชื่นชอบแชทบอทที่ดีมาตั้งแต่ SmarterChild

ในขณะที่ GPT-3 และ GPT-4 เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่ได้รับความนิยมสูงสุดในขณะนี้ แต่ในอีกไม่กี่ปีข้างหน้า มีแนวโน้มว่าจะมีการแข่งขันสูงขึ้นมาก ตัวอย่างเช่น Google มี Bard ซึ่งเป็นแชทบอท AI ซึ่งขับเคลื่อนโดยโปรแกรมภาษา Pathways Language Model (PaLM 2) แต่สำหรับตอนนี้ ข้อเสนอของ OpenAI เป็นมาตรฐานอุตสาหกรรมโดยพฤตินัย มันเป็นเพียงเครื่องมือที่ง่ายที่สุดสำหรับผู้คนที่จะรับมือ

ดังนั้นคำตอบของ "ChatGPT ทำงานอย่างไร" เป็นพื้น: GPT-3 และ GPT-4 แต่ลองเจาะลึกลงไปอีกหน่อย

ChatGPT คืออะไร?

ChatGPT เป็นแอปที่สร้างโดย OpenAI เมื่อใช้โมเดลภาษา GPT จะสามารถตอบคำถามของคุณ เขียนข้อความ ร่างอีเมล สนทนา อธิบายโค้ดในภาษาโปรแกรมต่างๆ แปลภาษาธรรมชาติเป็นโค้ด และอื่นๆ อีกมากมาย หรืออย่างน้อยก็ลองทำตามทั้งหมดโดยใช้ภาษาธรรมชาติ แจ้งให้คุณป้อนอาหาร มันเป็นแชทบอท แต่ดีจริงๆ

แม้ว่าจะเป็นการดีที่จะลองเล่นดูว่าคุณต้องการเขียนโคลงของเชกสเปียร์เกี่ยวกับสัตว์เลี้ยงของคุณหรือหาแนวคิดเล็กน้อยสำหรับหัวเรื่องสำหรับอีเมลทางการตลาดบางฉบับ แต่ก็เป็นสิ่งที่ดีสำหรับ OpenAI เป็นวิธีรับข้อมูล จำนวนมาก จากผู้ใช้จริงและทำหน้าที่เป็นตัวอย่างที่น่าสนใจสำหรับพลังของ GPT ซึ่งอาจทำให้รู้สึกคลุมเครือเล็กน้อยเว้นแต่คุณจะเรียนรู้เกี่ยวกับเครื่องอย่างลึกซึ้ง

ตอนนี้ ChatGPT มี GPT สองรุ่น ค่าเริ่มต้น GPT-3.5 มีประสิทธิภาพน้อยกว่า แต่ทุกคนสามารถใช้ได้ฟรี GPT-4 ขั้นสูงนั้นจำกัดไว้สำหรับสมาชิก ChatGPT Plus และแม้แต่พวกเขายังได้รับคำถามจำนวนจำกัดทุกวัน

คุณลักษณะเด่นอย่างหนึ่งของ ChatGPT คือสามารถจดจำการสนทนาที่คุณกำลังสนทนาด้วยได้ ซึ่งหมายความว่าสามารถรวบรวมบริบทจากสิ่งที่คุณถามก่อนหน้านี้แล้วใช้ข้อมูลนั้นเพื่อแจ้งการสนทนากับคุณ คุณยังสามารถขอให้ทำใหม่และแก้ไขได้ และมันจะอ้างอิงกลับไปยังสิ่งที่คุณเคยคุยกันมาก่อน มันทำให้การโต้ตอบกับ AI รู้สึกเหมือนกลับไปกลับมาอย่างแท้จริง

หากคุณต้องการสัมผัสมันจริง ๆ ไปใช้เวลาห้านาทีเล่นกับ ChatGPT ตอนนี้ (ฟรี!) แล้วกลับมาอ่านเกี่ยวกับวิธีการทำงาน

ChatGPT ทำงานอย่างไร

ชุดข้อมูลขนาดมหึมานี้ใช้เพื่อสร้างโครงข่ายประสาทเทียมสำหรับการเรียนรู้เชิงลึก [ ... ] ซึ่งจำลองมาจากสมองของมนุษย์ ซึ่งช่วยให้ ChatGPT เรียนรู้รูปแบบและความสัมพันธ์ในข้อมูลข้อความ [ ... ] เพื่อทำนายว่าข้อความใดควรอยู่ถัดไปในประโยคที่กำหนด .

ChatGPT ทำงานโดยพยายามทำความเข้าใจข้อความแจ้งของคุณ จากนั้นจึงพ่นคำที่คาดการณ์ว่าจะตอบคำถามของคุณได้ดีที่สุด โดยพิจารณาจากข้อมูลที่ได้รับการฝึกอบรมมา

เรามาพูดถึงการฝึกนั้นกันเถอะ เป็นกระบวนการที่ AI ที่เพิ่งตั้งไข่จะได้รับกฎพื้นฐาน จากนั้นจึงใส่สถานการณ์หรือให้ข้อมูลจำนวนมากเพื่อทำงานเพื่อพัฒนาอัลกอริทึมของตัวเอง

GPT-3 ได้รับการฝึกอบรมเกี่ยวกับ "โทเค็น" ประมาณ 500 พันล้านรายการ ซึ่งช่วยให้โมเดลภาษาสามารถกำหนดความหมายและคาดเดาข้อความที่ตามมาที่เป็นไปได้ได้ง่ายขึ้น คำหลายคำจับคู่กับโทเค็นเดียว แม้ว่าคำที่ยาวกว่าหรือซับซ้อนกว่ามักจะแบ่งออกเป็นหลายโทเค็น โดยเฉลี่ยแล้ว โทเค็นจะมีความยาวประมาณ 4 อักขระ OpenAI ยังคงเงียบเกี่ยวกับการทำงานภายในของ GPT-4 แต่เราสามารถสรุปได้อย่างปลอดภัยว่าได้รับการฝึกอบรมในชุดข้อมูลเดียวกันเนื่องจากมีประสิทธิภาพมากกว่า

โทเค็นทั้งหมดมาจากคลังข้อมูลจำนวนมหาศาลที่มนุษย์เขียนขึ้น ซึ่งรวมถึงหนังสือ บทความ และเอกสารอื่นๆ ในหัวข้อ สไตล์ และประเภทที่แตกต่างกันทั้งหมด และเนื้อหาที่คัดมาจากอินเทอร์เน็ตแบบเปิดในปริมาณที่ไม่น่าเชื่อ โดยพื้นฐานแล้วมันได้รับอนุญาตให้กระทืบความรู้ทั้งหมดของมนุษย์

ชุดข้อมูลขนาดมหึมานี้ถูกใช้เพื่อสร้างเครือข่ายประสาทการเรียนรู้เชิงลึก ซึ่งเป็นอัลกอริธึมถ่วงน้ำหนักที่ซับซ้อน หลายชั้น ซึ่งจำลองแบบมาจากสมองมนุษย์ ซึ่งทำให้ ChatGPT เรียนรู้รูปแบบและความสัมพันธ์ในข้อมูลข้อความ และใช้ประโยชน์จากความสามารถในการสร้างสิ่งที่เหมือนมนุษย์ การตอบสนองโดยการคาดคะเนว่าข้อความใดควรอยู่ถัดไปในประโยคที่กำหนด

แม้ว่าที่จริงแล้วสิ่งนั้นจะขายต่ำกว่าราคาอย่างมหาศาล ChatGPT ไม่ทำงานในระดับประโยค แต่จะสร้างข้อความของคำ ประโยค และแม้แต่ย่อหน้าหรือบทที่จะตามมา ไม่ใช่ข้อความคาดเดาในโทรศัพท์ของคุณที่คาดเดาคำถัดไปอย่างโผงผาง กำลังพยายามสร้างการตอบสนองที่สอดคล้องกันอย่างเต็มที่ต่อพรอมต์ใดๆ

เพื่อปรับแต่งความสามารถของ ChatGPT ในการตอบสนองต่อข้อความแจ้งต่างๆ ที่หลากหลายยิ่งขึ้น จึงได้รับการปรับให้เหมาะสมสำหรับการสนทนาด้วยเทคนิคที่เรียกว่าการเรียนรู้แบบเสริมแรงด้วยความคิดเห็นจากมนุษย์ (RLHF) โดยพื้นฐานแล้ว มนุษย์สร้างโมเดลรางวัลที่มีข้อมูลเปรียบเทียบ (ซึ่ง AI Trainer จัดอันดับการตอบสนองของโมเดลตั้งแต่ 2 โมเดลขึ้นไป) เพื่อให้ AI สามารถเรียนรู้ได้ว่าการตอบสนองใดดีที่สุด

กลับไปที่โครงข่ายประสาทเทียมที่ก่อตัวขึ้น จากการฝึกอบรมทั้งหมดนั้น โครงข่ายประสาทเทียมของ GPT-3 มีพารามิเตอร์หรือตัวแปร 175 พันล้านตัวที่อนุญาตให้รับอินพุต ซึ่งก็คือพรอมต์ของคุณ จากนั้นจึงอิงตามค่าและการถ่วงน้ำหนักที่มอบให้กับพารามิเตอร์ต่างๆ (และการสุ่มจำนวนเล็กน้อย ) แสดงผลสิ่งที่คิดว่าตรงกับคำขอของคุณมากที่สุด OpenAI ไม่ได้ระบุว่า GPT-4 มีพารามิเตอร์กี่ตัว แต่คาดเดาได้อย่างปลอดภัยว่ามีค่ามากกว่า 175 พันล้าน และน้อยกว่าค่าพารามิเตอร์ 100 ล้านล้านพารามิเตอร์ที่เคยลือกัน โดยไม่คำนึงถึงจำนวนที่แน่นอน พารามิเตอร์ที่มากขึ้นไม่ได้หมายความว่าดีขึ้นโดยอัตโนมัติ พลังที่เพิ่มขึ้นของ GPT-4 บางส่วนอาจมาจากการมีพารามิเตอร์มากกว่า GPT-3 แต่ส่วนมากอาจลดลงเนื่องจากการปรับปรุงวิธีการฝึกฝน

ในท้ายที่สุด วิธีที่ง่ายที่สุดในการจินตนาการก็คือเหมือนกับเกม "จบประโยค" เกมหนึ่งที่คุณเคยเล่นตอนเด็กๆ

ในท้ายที่สุด วิธีที่ง่ายที่สุดในการจินตนาการก็คือเหมือนกับเกม "จบประโยค" เกมหนึ่งที่คุณเคยเล่นตอนเด็กๆ ตัวอย่างเช่น เมื่อฉันให้ ChatGPT โดยใช้ GPT-3 ข้อความแจ้ง "Zapier คือ…" ระบบตอบกลับว่า:

"Zapier เป็นเครื่องมืออัตโนมัติบนเว็บที่ช่วยให้ผู้ใช้สามารถเชื่อมต่อเว็บแอปพลิเคชันต่างๆ เข้าด้วยกัน เพื่อทำงานซ้ำๆ โดยอัตโนมัติและปรับปรุงเวิร์กโฟลว์"

นั่นเป็นประโยคแบบที่คุณพบได้ในบทความหลายร้อยบทความที่อธิบายถึงสิ่งที่ Zapier ทำ ดังนั้นมันจึงสมเหตุสมผลที่จะพูดออกมาที่นี่ แต่เมื่อบรรณาธิการของฉันแจ้งแบบเดียวกัน มันบอกว่า:

"Zapier เป็นเครื่องมืออัตโนมัติบนเว็บที่ช่วยให้ผู้ใช้สามารถเชื่อมต่อเว็บแอปพลิเคชันต่างๆ และทำให้เวิร์กโฟลว์ระหว่างกันเป็นแบบอัตโนมัติ"

ค่อนข้างคล้ายกัน แต่ก็ไม่ใช่คำตอบเดียวกันทั้งหมด การสุ่มนั้น (ซึ่งคุณสามารถควบคุมได้ในแอป GPT-3 บางแอปด้วยการตั้งค่าที่เรียกว่า "อุณหภูมิ") ทำให้มั่นใจได้ว่า ChatGPT ไม่ใช่แค่การตอบกลับทุกคำตอบด้วยจำนวนเงินที่เท่ากับคำตอบสต็อก มันเรียกใช้แต่ละพรอมต์ผ่านเครือข่ายประสาททั้งหมดในแต่ละครั้ง และทอยลูกเต๋าสองสามครั้งเพื่อให้ทุกอย่างสดใหม่อยู่เสมอ ไม่น่าจะเริ่มอ้างว่า Zapier เป็นสีจากดาวอังคาร แต่จะผสมคำต่อไปนี้ตามความน่าจะเป็นที่เกี่ยวข้องกัน

(สำหรับสิ่งที่คุ้มค่า เมื่อทำงานบน GPT-4 ChatGPT กล่าวว่า: " Zapier เป็นเครื่องมืออัตโนมัติบนเว็บที่ช่วยให้ผู้ใช้สามารถรวมและทำงานอัตโนมัติระหว่างแอปพลิเคชันและบริการออนไลน์ต่างๆ ได้" เหมือนกัน!)

พ่นคำไม่เป็นความรู้

ผู้ผลิต ChatGPT เป็นคนแรกที่กล่าวว่าสามารถสร้างข้อมูลที่ไม่ถูกต้อง (และอาจเป็นอันตราย) แม้ว่าพวกเขาจะทำงานอย่างหนักเพื่อแก้ไขก็ตาม

นี่คือตัวอย่างที่เชื่อง เมื่อฉันถาม ChatGPT โดยใช้ GPT-3 และ GPT-4 เพื่อตอบกลับว่า "Harry Guinness คือ..." GPT-3 ก่อนตอบกลับโดยถามว่า Harry Guinness คืออะไร คำถามที่ดี—มีเราสองคนอย่างแท้จริง! ผมก็เลยบอกว่า "แฮรี่ กินเนสส์ คนเขียน" (ก็ผมนั่นแหละ) GPT-4 เดาได้ทันทีว่าฉันเป็นใคร แม้ว่าคำตอบทั้งสองจะน่าสนใจ:

GPT-3: Harry Guinness เป็นนักเขียนและนักข่าวอิสระในไอร์แลนด์ เขาเขียนให้กับสื่อสิ่งพิมพ์ต่างๆ เช่น The New York Times, The Guardian, The Huffington Post และ Popular Mechanics เขาครอบคลุมหัวข้อต่างๆ ตั้งแต่เทคโนโลยีและการถ่ายภาพ ไปจนถึงการเดินทางและวัฒนธรรม

GPT-4: Harry Guinness เป็นนักเขียน ช่างภาพ และผู้เชี่ยวชาญด้านเทคโนโลยีชาวไอริช เขาได้เขียนให้กับสิ่งพิมพ์ต่างๆ รวมถึง How-To Geek, Lifehacker และ Tuts+ งานของเขามุ่งเน้นไปที่เทคโนโลยี บทแนะนำ และเคล็ดลับเป็นหลัก เช่นเดียวกับการถ่ายภาพและการแก้ไขภาพ Guinness ได้สร้างชื่อเสียงในการสร้างคำแนะนำโดยละเอียดที่ช่วยให้ผู้อ่านเข้าใจเรื่องที่ซับซ้อนหรือแก้ปัญหาได้อย่างตรงไปตรงมา

บรรทัดแรกและบรรทัดสุดท้ายของ GPT-3 ถูกดึงออกมาแทบจะทุกคำจากเว็บไซต์ต่างๆ ของฉันและประวัติผู้เขียนในเว็บ (แม้ว่าโดยปกติแล้วฉันจะระบุว่าตัวเองเป็นนักเขียนและช่างภาพอิสระ ไม่ใช่นักข่าวก็ตาม) แต่รายการสิ่งพิมพ์นั้นถูกสร้างขึ้นโดยพื้นฐานแล้ว ฉันเคยเขียนให้กับ The New York Times แต่ไม่ใช่สำหรับ The Guardian , The Huffington Post หรือ Popular Mechanics (ฉันเขียนเป็นประจำสำหรับ Popular Science ดังนั้นนั่นอาจเป็นที่มา)

GPT-4 ทำให้ส่วนของช่างภาพถูกต้องและแสดงรายชื่อสิ่งพิมพ์ที่ฉันเขียนให้ ซึ่งน่าประทับใจ แม้ว่าพวกเขาจะไม่ใช่สิ่งที่ฉันภูมิใจที่สุดก็ตาม เป็นตัวอย่างที่ดีของวิธีที่ OpenAI สามารถเพิ่มความแม่นยำของ GPT-4 เมื่อเทียบกับ GPT-3 แม้ว่าอาจไม่ได้ให้คำตอบที่ถูกต้อง ที่สุด เสมอไป

แต่ขอกลับไปที่ GPT-3 เนื่องจากข้อผิดพลาดให้ตัวอย่างที่น่าสนใจเกี่ยวกับสิ่งที่เกิดขึ้นเบื้องหลังใน ChatGPT มันไม่รู้อะไรเกี่ยวกับฉันเลยจริงๆ ไม่แม้แต่จะคัดลอก/วางจากอินเทอร์เน็ตและเชื่อถือแหล่งที่มาของข้อมูล แต่เป็นเพียงการคาดคะเนชุดคำที่จะตามมาตามจุดข้อมูลหลายพันล้านจุดที่มี

ตัวอย่างเช่น: The New York Times จัดกลุ่มกับ The Guardian และ Huffington Post บ่อยกว่าการจัดกลุ่มที่ฉันเขียนถึง เช่น Wired , Outside , The Irish Times และแน่นอน Zapier ดังนั้นเมื่อต้องค้นหาสิ่งที่ควรติดตามจาก The New York Times จึงไม่ดึงข้อมูลจากข้อมูลที่ตีพิมพ์เกี่ยวกับตัวฉัน มันดึงรายการสิ่งพิมพ์ขนาดใหญ่จากข้อมูลการฝึกอบรมทั้งหมดที่มี มันฉลาดมากและดูน่าเชื่อถือ แต่ก็ไม่จริง

GPT-4 ทำงานได้ดีขึ้นมากและตอกย้ำสิ่งตีพิมพ์ แต่ส่วนที่เหลือของสิ่งที่พูดจริงๆรู้สึกเหมือนประโยคที่ตามมาที่น่าเชื่อถือ ฉันไม่คิดว่ามันมีค่ามากมายสำหรับชื่อเสียงของฉัน มันแค่พูดในสิ่งที่ไบโอพูด การซ่อนวิธีการทำงานนั้นดีกว่า GPT-3 แม้ว่าจะใช้เทคนิคเดียวกันมากก็ตาม

ถึงกระนั้นก็น่าประทับใจมากที่ GPT ได้ปรับปรุงไปมากแล้ว สำหรับตอนนี้ GPT-4 ถูกล็อกไว้หลังการสมัครแบบพรีเมียม ดังนั้นเนื้อหา ChatGPT ส่วนใหญ่ที่คุณเห็นจะใช้ GPT-3 แต่อาจมีการเปลี่ยนแปลงในอีกไม่ช้า ใครจะรู้ว่า GPT-5 จะนำมาซึ่งอะไร

ChatGPT API คืออะไร

OpenAI ไม่มีทัศนคติแบบเรากับเทคโนโลยี บริษัทมีแพลตฟอร์ม API ที่ช่วยให้นักพัฒนาสามารถรวมพลังของ ChatGPT เข้ากับแอพและบริการของตนเองได้ (แน่นอนในราคา)

Zapier ใช้ ChatGPT API เพื่อขับเคลื่อนการรวม ChatGPT ของตัวเอง ซึ่งช่วยให้คุณเชื่อมต่อ ChatGPT กับแอปอื่นๆ นับพันและเพิ่ม AI ให้กับเวิร์กโฟลว์ที่สำคัญต่อธุรกิจของคุณ ต่อไปนี้คือตัวอย่างบางส่วนในการเริ่มต้นใช้งาน แต่คุณสามารถเรียกใช้ ChatGPT จากแอปใดก็ได้

คุณยังสามารถใช้ประโยชน์จากโมเดลอื่นๆ ของ OpenAI เช่น DALL·E และ Whisper ด้วยการผสานรวม OpenAI ของ Zapier ทำให้เวิร์กโฟลว์อัตโนมัติที่เกี่ยวข้องกับการสร้างภาพและการถอดความเสียง ส่งตรงจากแอพที่คุณใช้อยู่แล้ว

การอ่านที่เกี่ยวข้อง: คุณสามารถ (และเมื่อใดที่คุณไม่ควร) ใช้ ChatGPT เพื่อเขียนสำเนาการตลาด

ChatGPT ทำงานอย่างไร

ChatGPT คืออะไร?

ChatGPT ทำงานอย่างไร

พ่นคำไม่เป็นความรู้

ChatGPT API คืออะไร

บทความที่เกี่ยวข้อง