อะไรคือ Auto-GPT และเป็นเวลาที่ต้องกังวลเกี่ยวกับ AI หรือไม่?

Auto-GPT เป็นเทคโนโลยีที่เปลี่ยนแปลงวงการอย่างต่อเนื่อง โดยสามารถปลดล็อกความสามารถใหม่ให้กับ ChatGPT ทำให้สามารถทำภารกิจด้วยตัวเองได้อย่างสมบูรณ์ โดยสร้างคำถามของตัวเองเพื่อทำงานให้สำเร็จ

การพูดถึง Auto-GPT เร็วกว่านักพูด ChatGPT มากเมื่อเร็ว ๆ นี้ และเป็นเรื่องที่ได้ทวีตด้วยอันดับหนึ่งบน Twitter ติดต่อกันหลายวัน

อะไรคือ Auto-GPT?

Auto-GPT เป็นหน้าต่างอินเทอร์เฟซเชิงทดลองที่เปิดให้มีการเชื่อมต่อกับ GPT-4 และ GPT-3.5 ซึ่งช่วยให้สามารถทำภารกิจตามที่กำหนดเอง (องค์กรมีอิสระ) ได้

จะต้องระบุรายการงานที่ต้องทำและ Auto-GPT จะทำการสมบูรณ์เสร็จให้

ในทางกลับกันกับ ChatGPT ที่ต้องการโปรมท์ที่ละเอียดมากมาย Auto-GPT สร้างโปรมด์ของตัวเองเพื่อปิดฉากการทำเป้าหมายที่กำหนดไว้

หากจำเป็น Auto-GPT จะเข้าถึงเว็บไซต์และเครื่องมือค้นหาเพื่อเก็บรวบรวมข้อมูลเพื่อทำภารกิจให้เสร็จสิ้น

สิ่งที่ทำให้ความสามารถในการรวบรวมข้อมูลภายนอกของ Auto-GPT น่าทึ่งก็คือ Auto-GPT มีความสามารถในการประเมินตนเองและสามารถยืนยันความถูกต้องของข้อมูลที่รวบรวมและทิ้งข้อมูลที่ไม่ถูกต้องหรือต่ำกว่าเกณฑ์และสร้างงานย่อยใหม่เพื่อรวบรวมข้อมูลที่ดีขึ้น

ความสามารถในการสร้างคำแนะนำเพื่อทำภารกิจเองเองเป็นเหตุผลที่มันถูกเรียกว่าเป็นตัวแทน AI ที่เป็นอิสระ

หน้า GitHub อย่างเป็นทางการสำหรับ Auto-GPT อธิบายถึงสิ่งนี้อย่างต่อไปนี้:

"Auto-GPT เป็นแอปพลิเคชันโอเพนซอร์สทดลองที่แสดงความสามารถของแบบจำลองภาษา GPT-4

โปรแกรมนี้ที่ได้รับการสนับสนุนจาก GPT-4 เชื่อมต่อความคิด LLM ต่อกันเพื่อทำให้ได้เป้าหมายที่คุณตั้ง

เป็นตัวอย่างแรกที่ GPT-4 ทำงานอิสระอย่างสมบูรณ์ Auto-GPT เป็นการผสานของเทคโนโลยี AI ที่ได้ทำให้เกิดความเปลี่ยนแปลงที่เกี่ยวข้องในขอบเขตที่เป็นไปได้"

ในการใช้งาน Auto-GPT ท่านจำเป็นต้องสร้างบัญชีที่เป็นบัญชีเสียงใน OpenAI ก่อน

หลังจากสร้างบัญชีที่เป็นสมาชิกแบบเสียตังค์แล้ว ขั้นต่อไปคือการขอรับ OpenAI API ซึ่งจะเชื่อมต่อ Auto-GPT กับบัญชี OpenAI ที่คุณใช้เข้าถึง และเรียกเก็บเงินค่าบริการตามจำนวนที่คุณใช้

API หมายถึง Application Programming Interface

นี่คือเทคโนโลยีที่ทำให้ซอฟต์แวร์สามารถสื่อสารอย่างปลอดภัยกับซอฟต์แวร์อื่นได้

API ช่วยให้ Auto-GPT สื่อสารกับ GPT-4 และ ChatGPT ของ OpenAI ได้

OpenAI อธิบายวิธีการทำงานของ API ของพวกเขา:

API ของ OpenAI สามารถนำมาใช้ในงานใดก็ได้ที่เกี่ยวข้องกับการเข้าใจหรือสร้างภาษาธรรมชาติ โค้ด หรือภาพได้เลย

เรามีรุ่นหลายรายการที่มีระดับพลังงานที่แตกต่างกันเหมาะสำหรับงานที่แตกต่างกัน และยังสามารถปรับแต่งโมเดลที่กำหนดเองของคุณได้อีกด้วย

โมเดลเหล่านี้สามารถใช้สำหรับทุกอย่างตั้งแต่สร้างเนื้อหาไปจนถึงการค้นหาและการจัดหมวดหมู่ทางด้านความหมาย

...API สนับสนุนด้วยชุดของโมเดลที่มีความสามารถและราคาต่างกัน

GPT-4 เป็นโมเดลล่าสุดและทรงพลังที่สุดของเรา

GPT-3.5-Turbo เป็นโมเดลที่ให้กำลังพลในการทำงานของ ChatGPT และถูกปรับปรุงให้เหมาะสำหรับรูปแบบการสนทนา

เจ้าของบัญชี OpenAI สามารถกำหนดขีดจำกัดที่เข้มงวดต่อยอดเงินที่ OpenAI จะเรียกเก็บ และเมื่อถึงขีดจำกัดครั้งนั้น บริการจะหยุดทำงาน

ผู้ใช้งานยังสามารถตั้งค่าขีดจำกัดการใช้งานที่อ่อนโยน ซึ่งจะส่งอีเมลแจ้งเตือนไปยังเจ้าของบัญชีเมื่อถึงขีดจำกัดที่ตั้งไว้

การกำหนดราคาขึ้นอยู่กับการเรียกเก็บค่าใช้จ่ายต่อหน่วยการวัดที่เรียกว่าโทเคน

โทเค็นสามารถถือเป็นหน่วยวัดของคำได้

OpenAI กำหนดโทเค็นดังนี้:

"สำหรับข้อความภาษาอังกฤษ 1 โทเค็นประมาณ 4 ตัวอักษรหรือ 0.75 คำ"

จำนวนคำ (โทเค็น) ที่ส่งผ่าน API ในรูปแบบของข้อความเริ่มต้นและจำนวนโทเค็น (คำ) ที่มีอยู่ในผลลัพธ์ถูกใช้คำนวณต้นทุนการใช้บริการ

ร้อยโทเค็นค่าใช้จ่ายเพียงบาทหนึ่งเท่ากับบาทเดียวแต่ละสตางค์, $0.002

ตัวอย่างของสิ่งที่ Auto-GPT สามารถทำได้

มีคนชื่อ Jon Miller (@botzero_net) แชร์บน Twitter ตัวอย่างที่ชาญฉลาดเกี่ยวกับสิ่งที่ Auto-GPT สามารถทำได้

เขาโพสต์ทวีตดังนี้:

“เป้าหมายของ AI: เขียนคำแนะนำในการสร้างภาพศิลปะที่ให้แรงบัลดาลใจให้กับมนุษย์ด้วยความกลัวใจ”

ตัวอย่างอีกตัวของ Auto-GPT ที่แชร์บน Twitter คือการสร้างบทความรีวิว

@SullyOmarr ส่งทวีตว่าเกิดอะไรต่อมา:

"ตัวอย่าง: มันทำการค้นหาโดยตรงที่ Google เพื่อหาบทวิจารณ์รองเท้ากันน้ำ 5 อันดับแรก"

เมื่อมันหาลิงก์แล้ว มันจะสร้างคำถามเอง เช่น

“ข้อดีและข้อเสียของรองเท้าแต่ละคู่คืออะไร”

“ข้อดีและข้อเสียของรองเท้ากันน้ำอันดับ 5 แต่ละคู่คืออะไร”

“รองเท้ากันน้ำอันดับ 5 สำหรับผู้ชาย”

แล้วเขาได้ระบุการวิเคราะห์ที่เกิดต่อมาดังนี้:

“ผมก็ไปวิเคราะห์เว็บไซต์ต่าง ๆ ต่อ ๆ กันโดยใช้การค้นหาข้อมูลในกูเกิล และปรับปรุงคำค้นหาจนกว่าผมจะพอใจกับผลลัพธ์ที่ได้

นี่คือตัวอย่างเมื่อมันคิด “อย่างมีวิจารณญาณ”

มันรู้ว่าบางรีวิวอาจมีแนวโน้มที่อื้อฉาว ดังนั้นจึงต้องทำการตรวจสอบสิ่งที่จะเชื่อมั่นได้

ตัวแทน Auto-GPT สร้างตัวแทนย่อยที่ได้รับมอบหมายให้ออกแบบเว็บไซต์ซึ่งใช้สำหรับการวิจัยและเมื่อตัวแทน AI ติดขัด ตัวแทนตัดสินใจวิธีการก้าวหน้าไปข้างหน้าโดยไม่ต้องขอความช่วยเหลือจากภายนอกใดๆ

ในที่สุดมันจบงานแล้ว การสร้างการวิเคราะห์หลายย่อหน้าของรองเท้าห้าคู่ เรียงลำดับข้อดีและข้อเสียของแต่ละคู่ เพิ่มเติมด้วยการเขียนคำอธิบายย่อๆและสรุปผลสุดท้าย

น่าตกใจที่กระบวนการวิจัย การวิเคราะห์ และการสร้างงานใช้เวลาเพียงแค่ แปดนาทีและใช้จ่ายแค่ สิบเซนต์สำหรับการใช้งาน GPT-4 ในการดำเนินการเสร็จสมบูรณ์

ระบบ Auto-GPT ทำงานอย่างไร?

ถ้า AI agent พบว่าตัวเองไม่สามารถทำภารกิจให้เสร็จสิ้นได้ จะสร้าง prompt ใหม่เพื่อค้นหาวิธีการดำเนินการต่อไป

Auto-GPT เป็นตัวแทน AI ที่สามารถแบ่งแยกตนเองได้ซึ่งให้ไม่จำเป็นต้องมีข้อสอบที่สร้างสรรค์และละเอียดอ่อน ทั้งหมดที่ต้องการคือชุดเป้าหมายสำหรับงานที่ต้องทำเสร็จ

มันจะสร้างร้อยของการกระตุ้นที่จำเป็นในการทำภารกิจให้สมบูรณ์

คุณภาพของ Auto-GPT นี้ถือว่าทำให้ GPT-4 และ ChatGPT มีความสามารถที่แข็งแกร่งมากยิ่งขึ้น ที่น่าตื่นตกใจและสามารถทำได้อย่างสมบูรณ์

หนึ่งในความลับของวิธีการทำงานของ Auto-GPT คือความสามารถในการสร้างงานย่อยสำหรับแต่ละเป้าหมาย โดยแยกงานแต่ละภาคออกเป็นขั้นตอนหลายขั้นตอน

การจัดการหน่วยความจำช่วยทำให้ Auto-GPT สามารถบันทึกข้อมูลสำคัญไว้เพื่อการใช้งานในระยะสั้นและระยะยาว เพื่อไม่ต้องทำซ้ำขั้นตอน สามารถเก็บข้อมูลเพื่อการประมวลผลและรายการย้อนหลังสำหรับการทำงานที่มีอยู่

หน้า GitHub สำหรับ Auto-GPT ระบุคุณสมบัตินี้ที่สำคัญที่ทำงานให้ Auto-GPT:

"การเข้าถึงอินเทอร์เน็ตสำหรับการค้นหาและการเก็บข้อมูล"
"การเข้าถึงเว็บไซต์และแพลตฟอร์มยอดนิยม"
"การจัดการหน่วยความจำระยะยาวและระยะสั้น"
"การจัดเก็บและสรุปไฟล์ด้วย GPT-3.5"
"ตัวอย่าง GPT-4 สำหรับการสร้างข้อความ"

คุณต้องใช้อะไรในการทำให้ Auto-GPT ทำงาน?

ออโต้-GPT ไม่มีอินเตอร์เฟซผู้ใช้งานที่เรียบง่ายเหมือนซอฟต์แวร์ที่เผยแพร่สำหรับผู้บริโภคหลายคนแบบได้

แต่อย่าให้เรื่องนี้เป็นสิ่งที่ทำให้คุณหดหู่ เพราะว่ามีวิธีให้ทุกคนสามารถใช้มันได้

มีความต้องการสองประการเพื่อใช้ Auto-GPT:

สภาพแวดล้อมในการเรียกใช้โปรแกรม
คีย์ API ของ OpenAI

หน้า GitHub ของ Auto-GPT รายชื่อสามสภาพแวดล้อมที่เราสามารถเลือกใช้ได้:

VSCode + devcontainer: ได้มีการกำหนดค่าในโฟลเดอร์ .devcontainer และสามารถใช้งานได้โดยตรง
Docker
Python 3.10 หรือใหม่กว่านั้น

หน้า GitHub ยังลิงก์ไปยังบทแนะนำสำหรับการติดตั้ง Python ในระบบปฏิบัติการ Windows

เอเย่นต์ AI Autonomous อื่น ๆ

Auto-GPT ไม่ใช่เฉพาะตัว AI ที่ทำงานอิสระ ยังมีตัวหนึ่งที่เรียกว่า BabyAGI ที่เป็นสคริปต์ภาษาไพทอน

เบบี้เว็ดดี้

หน้า GitHub มีคำอธิบายดังนี้:

“สคริปต์ Python นี้เป็นตัวอย่างของระบบการจัดการงานขับเคลื่อนด้วย AI ระบบนี้ใช้ OpenAI และ Pinecone APIs เพื่อสร้าง จัดลำดับ และดำเนินการงาน หลักการหลังของระบบนี้คือการสร้างงานโดยอิงตามผลลัพธ์ของงานก่อนหน้าและวัตถุประสงค์ที่กำหนดไว้ล่วงหน้า."

สคริปต์จะใช้ความสามารถในการประมวลภาษาธรรมชาติ (NLP) ของ OpenAI เพื่อสร้างงานใหม่ๆ ขึ้นมาโดยใช้วัตถุประสงค์เป็นแหล่งกำหนด และใช้ Pinecone ในการเก็บรักษาและเรียกดูผลลัพธ์ของงานเพื่อให้ได้บริบท

นี่เป็นเวอร์ชั่นที่หลีกเลี่ยงของต้นฉบับ Task-Driven Autonomous Agent (28 มีนาคม 2566)"

ถ้าทุกอย่างดูซับซ้อนมากเกินไป ยังมีวิธีให้ผู้ไม่ได้เป็นนักพัฒนาโค้ดใช้ AI Agents เช่น Auto-GPT และ BabyAGI ได้อย่างเหมาะสม

วิธีง่ายๆในการเรียกใช้เอเจนต์ AI

อัตราการนวัตกรรมของ AI ตอนนี้เร็วเป็นระดับที่น่าจะเป็นปริศนา เพียงสองสัปดาห์ที่ผ่านมานักพัฒนาได้สร้างวิธีทดแทนในการทำงานของ Auto-GPT ที่มีส่วนติดต่อที่เข้าใจง่ายแก่ผู้ใช้

ส่วนติดต่อเหล่านี้กำลังอยู่ในระหว่างการทดลองหรือโหมดเบต้า, แต่การทำงานของมันดีมาก

Cognosys.ai

หน้าต่างผู้ใช้ตัวอินเทอร์เฟซ AI ออนไลน์ใหม่สุดที่ชื่อ Cognosys.ai โดยคุณยังจำเป็นต้องมี OpenAI API key เพื่อใช้เว็บอินเตอร์เฟซ Cognosys.ai

หลังจากที่คุณได้รับรหัส API ของ OpenAI ขั้นตอนถัดไปคือเข้าสู่ระบบด้วย Google ID ของคุณหรือสร้างบัญชีผู้ใช้และรหัสผ่านใหม่

ตอนนี้การใช้ตัวแทน AI ง่ายเพียงแค่กรอกแบบฟอร์มและเฝ้าดูเครื่องจักรทำงานเอง

เอเจนต์.gpt

อินเตอร์เฟซที่ใช้ง่ายอีกตัวคือ AgentGPT ที่อยู่ในการทดสอบรุ่น beta ด้วย AgentGPT ทำงานในลักษณะเดียวกันกับ Cognosys.ai

ตัวแปลง AgentGPT อธิบายตัวเองว่าดังนี้:

"AgentGPT ช่วยให้คุณสามารถกำหนดค่าและใช้งานตัวแทนงาน AI ในรูปแบบที่เป็นอิสระได้

ตั้งชื่อ AI ที่กำหนดเองของคุณและให้มันไปสู่เป้าหมายใดๆ ที่คุณต้องการได้ มันจะพยายามที่จะเติมเต็มเป้าหมายโดยการคิดเกี่ยวกับงานที่ต้องทำ ดำเนินการและเรียนรู้จากผลลัพธ์ 🚀

แพลตฟอร์มนี้อยู่ในช่วงเบต้า ณ ขณะนี้เรากำลังทำงานเพิ่มเติมที่:

ความจำระยะยาว

การเรียกดูเว็บ

การแอบเข้าถึงเว็บไซต์และคน"

แท้จริงแล้ว จะมี Tweet จากผู้สร้างของ AgentGPT ที่อธิบายเพิ่มเติม:

"มันทำงานโดยใช้โมเดลในการสร้างรายการงานและดำเนินการทดลองเบื้องต้นกับงาน โดยประเมินว่างานได้รับการดำเนินการเรียบร้อยหรือต้องมีการดำเนินการย่อยเพิ่มเติม"

"ในอนาคตเราจะมีหน่วยความจำระยะยาวผ่าน @pinecone และรุ่นโมเดลจะมีความสามารถในการสอบถามข้อมูลบนเว็บ..."

Godmode AI

หนึ่งในอินเตอร์เฟซ AI ล่าสุดคือชื่อเรียก Godmode

ในการใช้งาน ต้องสร้างงานก่อน
อินเทอร์เฟซจะตอบสนองด้วยข้อเสนอให้ใช้งานที่นิยามงานนั้น

การเลือกหนึ่งในข้อเสนอที่เราได้รับ จะเปิดใช้งานตัวแทนปัญญาประดิษฐ์ที่เริ่มทำงานของมัน

Godmode ต้องการเข้าสู่ระบบด้วยบัญชี Google, GitHub หรือ Twitter

ในขณะนี้ใช้การใช้งานโหมดพระเจ้าไม่ต้องใช้คีย์ API จาก OpenAI เพื่อให้การทำงาน แต่การใช้คีย์ API จะเพิ่มกำลังการทำงานของ GPT-4 เข้าสู่ผลลัพธ์ของโหมดพระเจ้า

ตัวแทน AI อัตโนมัติ

บางคนกำลังตกใจกับ ChatGPT อยู่

แต่ตัวอักษร AI อิสระเช่น Auto-GPT เปิดเผยว่าสินค้าของ OpenAI สามารถทำอะไรได้มากกว่านั้น

การพัฒนาตัวแทน AI ที่ไม่ต้องการควบคุมเองเป็นสิ่งใหม่และล้ำค่า มันถูกสร้างขึ้นโดยนักพัฒนาและไม่ใช่ บริษัทใหญ่เช่น OpenAI และ Google

เทคโนโลยีเหล่านี้ยังเป็นเทคโนโลยีที่อยู่ในขั้นตอนการทดลองและเบต้า แต่มีบางส่วนที่เสถียรพอที่จะทำภารกิจที่น่าประทับใจในระดับที่คนต้องการจากมนุษย์ได้

เทคโนโลยีเช่น Auto-GPT ทำให้ง่ายต่อการจินตนาการถึงจุดหนึ่งที่นายจ้างสามารถจ้างหนึ่งคนที่จะมอบหมายงานให้กับตัวแทนปัญญาประดิษฐ์เพื่อทำงานแทนสำหรับพนักงานทั้งห้าคน

ไม่ยากที่จะนึกภาพเวลาที่นายจ้างสามารถปล่อยตัวแทน AI ที่จัดการตัวแทน AI โดยไม่ต้องมีผู้ควบคุมมนุษย์อีกต่อไป