ไตรมาสที่ 6 ของ OpenAI: ไม่มีการฝึกฝน GPT-4 ด้วยข้อมูลลูกค้า API

ภาพโอเพ่นเอะ-ความเปลี่ยนแปลงความเป็นส่วนตัว-6457d3fd3d25f-sej-760x400.png

ในการเปลี่ยนแปลงที่สำคัญจากวิธีการก่อนหน้านี้ OpenAI ได้ประกาศว่าจะไม่ใช้ข้อมูลของลูกค้าที่ส่งผ่าน API เพื่อฝึกสมรรถภาพของระบบตัวแบบภาษาที่กว้างขวางของ OpenAI เช่น GPT-4 อีกต่อไป

การเปลี่ยนแปลงได้รับการยืนยันโดย Sam Altman ประธานเจ้าหน้าที่บริหาร OpenAI ในการสัมภาษณ์ล่าสุดกับ CNBC

วิธีการใหม่ของ OpenAI ในการจัดการข้อมูลผู้ใช้

นโยบายการเปลี่ยนแปลงของ OpenAI ได้ถูกนำมาใช้งานเมื่อวันที่ 1 มีนาคม พ.ศ. 2566 โดยบริษัทได้อัพเดทข้อกำหนดการให้บริการเพื่อสะท้อนความมุ่งมั่นใหม่เพื่อความเป็นส่วนตัวของผู้ใช้ได้อย่างไม่เป็นทางการเสียงส่วนที่ด้วยความรับผิดชอบ

Altman ชี้แจงว่า "ลูกค้าต้องการให้เราไม่ฝึกฝนด้วยข้อมูลของพวกเขาอย่างชัดเจน ดังนั้นเราได้เปลี่ยนแผน: เราจะไม่ทำเช่นนั้น"

APIs หรือ application programming interfaces เป็นเฟรมเวิร์กเทคโนโลยีที่อนุญาตให้ลูกค้าเชื่อมต่อโดยตรงกับซอฟต์แวร์ของ OpenAI

Altman กล่าวว่า OpenAI ไม่ได้ใช้ข้อมูล API สำหรับการฝึกโมเดล "เป็นเวลาสักระยะหนึ่ง" แนะนำว่าประกาศอย่างเป็นทางการนี้จะสถานะร่วมที่มีอยู่แล้ว

ผลกระทบต่อลูกค้าทางธุรกิจ

การเคลื่อนไหวของ OpenAI จะมีผลกระทบที่กว้างขวางมากโดยเฉพาะต่อลูกค้าทางธุรกิจของมันซึ่งรวมถึงบริษัทใหญ่เช่น Microsoft, Salesforce และ Snapchat

บริษัทเหล่านี้มีโอกาสที่จะใช้ความสามารถของ OpenAI API สำหรับการดำเนินงานของพวกเขา ดังนั้นการเปลี่ยนแปลงด้านความเป็นส่วนตัวและการป้องกันข้อมูลเป็นเรื่องที่เกี่ยวข้องกับพวกเขาอย่างเฉพาะเจาะจง

อย่างไรก็ตาม, มาตรการป้องกันข้อมูลใหม่นี้ใช้เฉพาะกับลูกค้าที่ใช้บริการ API ของบริษัทเท่านั้น ข้อกำหนดการให้บริการใหม่ของ OpenAI ยกมาว่า "เราอาจใช้เนื้อหาจากบริการอื่นนอกเหนือจาก API ของเรา"

ด้วยเหตุนี้ รูปแบบอื่นของการนำเข้าข้อมูล เช่น ข้อความที่ป้อนเข้าไปในแชทบอท ChatGPT ที่ได้รับความนิยม อาจยังถูกใช้งานโดย OpenAI นอกจากนั้น ข้อมูลจะถูกใช้งานผ่าน API เท่านั้นที่จะถูกแบ่งปัน

ผลกระทบต่ออุตสาหกรรมทั่วไป

การเปลี่ยนแปลงนโยบายของ OpenAI เกิดขึ้นเมื่ออุตสาหกรรมต้องต่อสู้กับผลกระทบที่อาจเกิดขึ้นจากโมเดลภาษาขนาดใหญ่ เช่น ChatGPT ของ OpenAI ที่อาจทดแทนสิ่งของที่มนุษย์สร้างขึ้นแบบดั้งเดิม

ตัวอย่างเช่นสหภาพนักเขียนอเมริกาประสานมือเริ่มกิจกรรมขณะที่การเจรจาระหว่างสหภาพและสตูดิโอภาพยนตร์ล้มเหลว เจ้าของสตูดิโอกำลังพูดถึงการจำกัดการใช้ OpenAI’s ChatGPT สำหรับการสร้างสคริปต์หรือการเขียนใหม่

การตัดสินใจของ OpenAI ที่ไม่นำข้อมูลลูกค้าไปใช้ในการฝึกอบรมเป็นจุดสำคัญในการสนทนาต่อเรื่องความเป็นส่วนตัวของข้อมูลและปัญหาสิทธิ์ในการใช้งาน AI ที่ยังคงเป็นเรื่องที่สำคัญในการสนทนาเหล่านี้เมื่อบริษัทต่อไปเรียกใช้และเผยแพร่เทคโนโลยี AI ไปอย่างต่อเนื่อง

การวิวัฒนาการของ ChatGPT: GPT-3 ไปสู่ GPT-4

สำคัญที่จะระบุว่า คำมั่นสัญญาของ OpenAI ที่ไม่ใช้ข้อมูลลูกค้าเพื่อการฝึก GPT-4 รุ่นล่าสุด ที่เปิดตัวเมื่อวันที่ 14 มีนาคม พ.ศ. 2566

GPT-4 มีการปรับปรุงหลายส่วนเมื่อเปรียบเทียบกับรุ่นก่อนหน้า GPT-3, รวมถึงขีดจำกัดของคำที่มีความยาวเพิ่มขึ้นอย่างมีนัยสำคัญ (25,000 เทียบกับขีดจำกัดคำ 3,000 คำของ ChatGPT), ขนาดต่างๆของช่องเก็บข้อมูลที่ใหญ่ขึ้นมากกว่า, และความสามารถในการวิเคราะห์และเข้าใจ เพิ่มขึ้น

คุณลักษณะอื่นที่น่าสังเกตเกี่ยวกับ GPT-4 คือความสามารถในการตระหนักและอสูรรณะข้อมูลจากภาพรวมกับข้อความ โมเดลล่าสุดนี้สร้างข้อความที่ใกล้เคียงมากขึ้นกับมนุษย์โดยใช้คุณสมบัติเช่นอีโมจิเพื่อให้รู้สึกได้เฉพาะตัวมากขึ้น

อย่างไรก็ตาม, ขนาดและสถาปัตยกรรมที่แน่ชัดของ GPT-4 ยังไม่ประกาศเปิดเผย, ทำให้เกิดการคาดเดาเกี่ยวกับรายละเอียดของโมเดล

อย่างไรก็ตาม ผู้บริหารฝ่ายบริหารของ OpenAI ได้ปฏิเสธข้อกล่าวหาเฉพาะที่เกี่ยวกับขนาดของโมเดลนี้

ในเชิงประสิทธิภาพ GPT-4 มี ความสามารถต่างๆ ในการสร้างข้อความ แต่ยังมีข้อจำกัดบางอย่างด้วย ตัวอย่างเช่น มันได้คะแนนอยู่ในอันดับที่ 54 ของผู้เข้าสอบ Graduate Record Examination (GRE) Writing และในช่วงอันดับที่ 43 - 59 ของผู้เข้าสอบ AP Calculus BC exam

นอกจากนี้ มันทำได้ดีกับงานเขียนโค้ดของ Leetcode ที่ง่าย แต่ประสิทธิภาพลดลงเมื่อเพิ่มความยากของงาน

ในขณะที่ข้อมูลเฉพาะเกี่ยวกับกระบวนการฝึกฝนของ GPT-4 ยังไม่ได้รับการเอกสารทางการอย่างเป็นทางการ อย่างไรก็ตาม สิ่งที่เราทราบก็คือ โมเดล GPT ทั่วไปนั้นมักเป็นการเรียนรู้ของเครื่องด้วยการเรียนรู้ของเครื่องในมาตราฐานขนาดใหญ่ที่มีช่วงข้อมูลที่หลากหลายบนอินเทอร์เน็ต

พร้อมที่จะมองหน้าไปข้างหน้า

ในผลที่เกิดจากการเปลี่ยนแปลงนโยบายการใช้ข้อมูลของ OpenAI, ข้อมูลที่ใช้สำหรับการฝึกฝนแบบจำลองภาษาจะไม่รวมถึงข้อมูลที่แชร์ผ่าน API ยกเว้นในกรณีที่ผู้ใช้เห็นด้วยและยอมร่วมผลงานในวัตถุประสงค์นี้

ในขณะที่เทคโนโลยีนี้ดีขึ้นและมีบทบาทที่สำคัญมากยิ่งขึ้นในชีวิตของเรา น่าสนใจที่บริษัทสามารถปรับตัวและตอบสนองต่อความกังวลเรื่องการรักษาความเป็นส่วนตัวของข้อมูลและการได้รับความเชื่อมั่นจากประชาชนได้

บทความที่เกี่ยวข้อง

ดูเพิ่มเติม >>

ปลดล็อกพลังของ AI ด้วย HIX.AI!