![รูปภาพ 3.jpg](https://static-lib.s3.amazonaws.com/cms/image3_0af6268332.jpg)
Auto-GPT เป็นเทคโนโลยีที่เปลี่ยนแปลงวงการอย่างต่อเนื่อง โดยสามารถปลดล็อกความสามารถใหม่ให้กับ ChatGPT ทำให้สามารถทำภารกิจด้วยตัวเองได้อย่างสมบูรณ์ โดยสร้างคำถามของตัวเองเพื่อทำงานให้สำเร็จ
การพูดถึง Auto-GPT เร็วกว่านักพูด ChatGPT มากเมื่อเร็ว ๆ นี้ และเป็นเรื่องที่ได้ทวีตด้วยอันดับหนึ่งบน Twitter ติดต่อกันหลายวัน
อะไรคือ Auto-GPT?
Auto-GPT เป็นหน้าต่างอินเทอร์เฟซเชิงทดลองที่เปิดให้มีการเชื่อมต่อกับ GPT-4 และ GPT-3.5 ซึ่งช่วยให้สามารถทำภารกิจตามที่กำหนดเอง (องค์กรมีอิสระ) ได้
จะต้องระบุรายการงานที่ต้องทำและ Auto-GPT จะทำการสมบูรณ์เสร็จให้
ในทางกลับกันกับ ChatGPT ที่ต้องการโปรมท์ที่ละเอียดมากมาย Auto-GPT สร้างโปรมด์ของตัวเองเพื่อปิดฉากการทำเป้าหมายที่กำหนดไว้
หากจำเป็น Auto-GPT จะเข้าถึงเว็บไซต์และเครื่องมือค้นหาเพื่อเก็บรวบรวมข้อมูลเพื่อทำภารกิจให้เสร็จสิ้น
สิ่งที่ทำให้ความสามารถในการรวบรวมข้อมูลภายนอกของ Auto-GPT น่าทึ่งก็คือ Auto-GPT มีความสามารถในการประเมินตนเองและสามารถยืนยันความถูกต้องของข้อมูลที่รวบรวมและทิ้งข้อมูลที่ไม่ถูกต้องหรือต่ำกว่าเกณฑ์และสร้างงานย่อยใหม่เพื่อรวบรวมข้อมูลที่ดีขึ้น
ความสามารถในการสร้างคำแนะนำเพื่อทำภารกิจเองเองเป็นเหตุผลที่มันถูกเรียกว่าเป็นตัวแทน AI ที่เป็นอิสระ
หน้า GitHub อย่างเป็นทางการสำหรับ Auto-GPT อธิบายถึงสิ่งนี้อย่างต่อไปนี้:
"Auto-GPT เป็นแอปพลิเคชันโอเพนซอร์สทดลองที่แสดงความสามารถของแบบจำลองภาษา GPT-4
โปรแกรมนี้ที่ได้รับการสนับสนุนจาก GPT-4 เชื่อมต่อความคิด LLM ต่อกันเพื่อทำให้ได้เป้าหมายที่คุณตั้ง
เป็นตัวอย่างแรกที่ GPT-4 ทำงานอิสระอย่างสมบูรณ์ Auto-GPT เป็นการผสานของเทคโนโลยี AI ที่ได้ทำให้เกิดความเปลี่ยนแปลงที่เกี่ยวข้องในขอบเขตที่เป็นไปได้"
ในการใช้งาน Auto-GPT ท่านจำเป็นต้องสร้างบัญชีที่เป็นบัญชีเสียงใน OpenAI ก่อน
หลังจากสร้างบัญชีที่เป็นสมาชิกแบบเสียตังค์แล้ว ขั้นต่อไปคือการขอรับ OpenAI API ซึ่งจะเชื่อมต่อ Auto-GPT กับบัญชี OpenAI ที่คุณใช้เข้าถึง และเรียกเก็บเงินค่าบริการตามจำนวนที่คุณใช้
API หมายถึง Application Programming Interface
นี่คือเทคโนโลยีที่ทำให้ซอฟต์แวร์สามารถสื่อสารอย่างปลอดภัยกับซอฟต์แวร์อื่นได้
API ช่วยให้ Auto-GPT สื่อสารกับ GPT-4 และ ChatGPT ของ OpenAI ได้
OpenAI อธิบายวิธีการทำงานของ API ของพวกเขา:
API ของ OpenAI สามารถนำมาใช้ในงานใดก็ได้ที่เกี่ยวข้องกับการเข้าใจหรือสร้างภาษาธรรมชาติ โค้ด หรือภาพได้เลย
เรามีรุ่นหลายรายการที่มีระดับพลังงานที่แตกต่างกันเหมาะสำหรับงานที่แตกต่างกัน และยังสามารถปรับแต่งโมเดลที่กำหนดเองของคุณได้อีกด้วย
โมเดลเหล่านี้สามารถใช้สำหรับทุกอย่างตั้งแต่สร้างเนื้อหาไปจนถึงการค้นหาและการจัดหมวดหมู่ทางด้านความหมาย
...API สนับสนุนด้วยชุดของโมเดลที่มีความสามารถและราคาต่างกัน
GPT-4 เป็นโมเดลล่าสุดและทรงพลังที่สุดของเรา
GPT-3.5-Turbo เป็นโมเดลที่ให้กำลังพลในการทำงานของ ChatGPT และถูกปรับปรุงให้เหมาะสำหรับรูปแบบการสนทนา
เจ้าของบัญชี OpenAI สามารถกำหนดขีดจำกัดที่เข้มงวดต่อยอดเงินที่ OpenAI จะเรียกเก็บ และเมื่อถึงขีดจำกัดครั้งนั้น บริการจะหยุดทำงาน
ผู้ใช้งานยังสามารถตั้งค่าขีดจำกัดการใช้งานที่อ่อนโยน ซึ่งจะส่งอีเมลแจ้งเตือนไปยังเจ้าของบัญชีเมื่อถึงขีดจำกัดที่ตั้งไว้
การกำหนดราคาขึ้นอยู่กับการเรียกเก็บค่าใช้จ่ายต่อหน่วยการวัดที่เรียกว่าโทเคน
โทเค็นสามารถถือเป็นหน่วยวัดของคำได้
OpenAI กำหนดโทเค็นดังนี้:
"สำหรับข้อความภาษาอังกฤษ 1 โทเค็นประมาณ 4 ตัวอักษรหรือ 0.75 คำ"
จำนวนคำ (โทเค็น) ที่ส่งผ่าน API ในรูปแบบของข้อความเริ่มต้นและจำนวนโทเค็น (คำ) ที่มีอยู่ในผลลัพธ์ถูกใช้คำนวณต้นทุนการใช้บริการ
ร้อยโทเค็นค่าใช้จ่ายเพียงบาทหนึ่งเท่ากับบาทเดียวแต่ละสตางค์, $0.002
ตัวอย่างของสิ่งที่ Auto-GPT สามารถทำได้
มีคนชื่อ Jon Miller (@botzero_net) แชร์บน Twitter ตัวอย่างที่ชาญฉลาดเกี่ยวกับสิ่งที่ Auto-GPT สามารถทำได้
เขาโพสต์ทวีตดังนี้:
“เป้าหมายของ AI: เขียนคำแนะนำในการสร้างภาพศิลปะที่ให้แรงบัลดาลใจให้กับมนุษย์ด้วยความกลัวใจ”
ตัวอย่างอีกตัวของ Auto-GPT ที่แชร์บน Twitter คือการสร้างบทความรีวิว
@SullyOmarr ส่งทวีตว่าเกิดอะไรต่อมา:
"ตัวอย่าง: มันทำการค้นหาโดยตรงที่ Google เพื่อหาบทวิจารณ์รองเท้ากันน้ำ 5 อันดับแรก"
เมื่อมันหาลิงก์แล้ว มันจะสร้างคำถามเอง เช่น
- “ข้อดีและข้อเสียของรองเท้าแต่ละคู่คืออะไร”
- “ข้อดีและข้อเสียของรองเท้ากันน้ำอันดับ 5 แต่ละคู่คืออะไร”
- “รองเท้ากันน้ำอันดับ 5 สำหรับผู้ชาย”
แล้วเขาได้ระบุการวิเคราะห์ที่เกิดต่อมาดังนี้:
“ผมก็ไปวิเคราะห์เว็บไซต์ต่าง ๆ ต่อ ๆ กันโดยใช้การค้นหาข้อมูลในกูเกิล และปรับปรุงคำค้นหาจนกว่าผมจะพอใจกับผลลัพธ์ที่ได้
นี่คือตัวอย่างเมื่อมันคิด “อย่างมีวิจารณญาณ”
มันรู้ว่าบางรีวิวอาจมีแนวโน้มที่อื้อฉาว ดังนั้นจึงต้องทำการตรวจสอบสิ่งที่จะเชื่อมั่นได้
ตัวแทน Auto-GPT สร้างตัวแทนย่อยที่ได้รับมอบหมายให้ออกแบบเว็บไซต์ซึ่งใช้สำหรับการวิจัยและเมื่อตัวแทน AI ติดขัด ตัวแทนตัดสินใจวิธีการก้าวหน้าไปข้างหน้าโดยไม่ต้องขอความช่วยเหลือจากภายนอกใดๆ
ในที่สุดมันจบงานแล้ว การสร้างการวิเคราะห์หลายย่อหน้าของรองเท้าห้าคู่ เรียงลำดับข้อดีและข้อเสียของแต่ละคู่ เพิ่มเติมด้วยการเขียนคำอธิบายย่อๆและสรุปผลสุดท้าย
น่าตกใจที่กระบวนการวิจัย การวิเคราะห์ และการสร้างงานใช้เวลาเพียงแค่ แปดนาทีและใช้จ่ายแค่ สิบเซนต์สำหรับการใช้งาน GPT-4 ในการดำเนินการเสร็จสมบูรณ์
ระบบ Auto-GPT ทำงานอย่างไร?
ถ้า AI agent พบว่าตัวเองไม่สามารถทำภารกิจให้เสร็จสิ้นได้ จะสร้าง prompt ใหม่เพื่อค้นหาวิธีการดำเนินการต่อไป
Auto-GPT เป็นตัวแทน AI ที่สามารถแบ่งแยกตนเองได้ซึ่งให้ไม่จำเป็นต้องมีข้อสอบที่สร้างสรรค์และละเอียดอ่อน ทั้งหมดที่ต้องการคือชุดเป้าหมายสำหรับงานที่ต้องทำเสร็จ
มันจะสร้างร้อยของการกระตุ้นที่จำเป็นในการทำภารกิจให้สมบูรณ์
คุณภาพของ Auto-GPT นี้ถือว่าทำให้ GPT-4 และ ChatGPT มีความสามารถที่แข็งแกร่งมากยิ่งขึ้น ที่น่าตื่นตกใจและสามารถทำได้อย่างสมบูรณ์
หนึ่งในความลับของวิธีการทำงานของ Auto-GPT คือความสามารถในการสร้างงานย่อยสำหรับแต่ละเป้าหมาย โดยแยกงานแต่ละภาคออกเป็นขั้นตอนหลายขั้นตอน
การจัดการหน่วยความจำช่วยทำให้ Auto-GPT สามารถบันทึกข้อมูลสำคัญไว้เพื่อการใช้งานในระยะสั้นและระยะยาว เพื่อไม่ต้องทำซ้ำขั้นตอน สามารถเก็บข้อมูลเพื่อการประมวลผลและรายการย้อนหลังสำหรับการทำงานที่มีอยู่
หน้า GitHub สำหรับ Auto-GPT ระบุคุณสมบัตินี้ที่สำคัญที่ทำงานให้ Auto-GPT:
- "การเข้าถึงอินเทอร์เน็ตสำหรับการค้นหาและการเก็บข้อมูล"
- "การเข้าถึงเว็บไซต์และแพลตฟอร์มยอดนิยม"
- "การจัดการหน่วยความจำระยะยาวและระยะสั้น"
- "การจัดเก็บและสรุปไฟล์ด้วย GPT-3.5"
- "ตัวอย่าง GPT-4 สำหรับการสร้างข้อความ"
คุณต้องใช้อะไรในการทำให้ Auto-GPT ทำงาน?
ออโต้-GPT ไม่มีอินเตอร์เฟซผู้ใช้งานที่เรียบง่ายเหมือนซอฟต์แวร์ที่เผยแพร่สำหรับผู้บริโภคหลายคนแบบได้
แต่อย่าให้เรื่องนี้เป็นสิ่งที่ทำให้คุณหดหู่ เพราะว่ามีวิธีให้ทุกคนสามารถใช้มันได้
มีความต้องการสองประการเพื่อใช้ Auto-GPT:
- สภาพแวดล้อมในการเรียกใช้โปรแกรม
- คีย์ API ของ OpenAI
หน้า GitHub ของ Auto-GPT รายชื่อสามสภาพแวดล้อมที่เราสามารถเลือกใช้ได้:
- VSCode + devcontainer: ได้มีการกำหนดค่าในโฟลเดอร์ .devcontainer และสามารถใช้งานได้โดยตรง
- Docker
- Python 3.10 หรือใหม่กว่านั้น
หน้า GitHub ยังลิงก์ไปยังบทแนะนำสำหรับการติดตั้ง Python ในระบบปฏิบัติการ Windows
เอเย่นต์ AI Autonomous อื่น ๆ
Auto-GPT ไม่ใช่เฉพาะตัว AI ที่ทำงานอิสระ ยังมีตัวหนึ่งที่เรียกว่า BabyAGI ที่เป็นสคริปต์ภาษาไพทอน
เบบี้เว็ดดี้
หน้า GitHub มีคำอธิบายดังนี้:
“สคริปต์ Python นี้เป็นตัวอย่างของระบบการจัดการงานขับเคลื่อนด้วย AI ระบบนี้ใช้ OpenAI และ Pinecone APIs เพื่อสร้าง จัดลำดับ และดำเนินการงาน หลักการหลังของระบบนี้คือการสร้างงานโดยอิงตามผลลัพธ์ของงานก่อนหน้าและวัตถุประสงค์ที่กำหนดไว้ล่วงหน้า."
สคริปต์จะใช้ความสามารถในการประมวลภาษาธรรมชาติ (NLP) ของ OpenAI เพื่อสร้างงานใหม่ๆ ขึ้นมาโดยใช้วัตถุประสงค์เป็นแหล่งกำหนด และใช้ Pinecone ในการเก็บรักษาและเรียกดูผลลัพธ์ของงานเพื่อให้ได้บริบท
นี่เป็นเวอร์ชั่นที่หลีกเลี่ยงของต้นฉบับ Task-Driven Autonomous Agent (28 มีนาคม 2566)"
ถ้าทุกอย่างดูซับซ้อนมากเกินไป ยังมีวิธีให้ผู้ไม่ได้เป็นนักพัฒนาโค้ดใช้ AI Agents เช่น Auto-GPT และ BabyAGI ได้อย่างเหมาะสม
วิธีง่ายๆในการเรียกใช้เอเจนต์ AI
อัตราการนวัตกรรมของ AI ตอนนี้เร็วเป็นระดับที่น่าจะเป็นปริศนา เพียงสองสัปดาห์ที่ผ่านมานักพัฒนาได้สร้างวิธีทดแทนในการทำงานของ Auto-GPT ที่มีส่วนติดต่อที่เข้าใจง่ายแก่ผู้ใช้
ส่วนติดต่อเหล่านี้กำลังอยู่ในระหว่างการทดลองหรือโหมดเบต้า, แต่การทำงานของมันดีมาก
Cognosys.ai
หน้าต่างผู้ใช้ตัวอินเทอร์เฟซ AI ออนไลน์ใหม่สุดที่ชื่อ Cognosys.ai โดยคุณยังจำเป็นต้องมี OpenAI API key เพื่อใช้เว็บอินเตอร์เฟซ Cognosys.ai
หลังจากที่คุณได้รับรหัส API ของ OpenAI ขั้นตอนถัดไปคือเข้าสู่ระบบด้วย Google ID ของคุณหรือสร้างบัญชีผู้ใช้และรหัสผ่านใหม่
ตอนนี้การใช้ตัวแทน AI ง่ายเพียงแค่กรอกแบบฟอร์มและเฝ้าดูเครื่องจักรทำงานเอง
![รูปภาพ 4.jpg](https://static-lib.s3.amazonaws.com/cms/image4_4e570a1be6.jpg)
เอเจนต์.gpt
อินเตอร์เฟซที่ใช้ง่ายอีกตัวคือ AgentGPT ที่อยู่ในการทดสอบรุ่น beta ด้วย AgentGPT ทำงานในลักษณะเดียวกันกับ Cognosys.ai
ตัวแปลง AgentGPT อธิบายตัวเองว่าดังนี้:
"AgentGPT ช่วยให้คุณสามารถกำหนดค่าและใช้งานตัวแทนงาน AI ในรูปแบบที่เป็นอิสระได้
ตั้งชื่อ AI ที่กำหนดเองของคุณและให้มันไปสู่เป้าหมายใดๆ ที่คุณต้องการได้ มันจะพยายามที่จะเติมเต็มเป้าหมายโดยการคิดเกี่ยวกับงานที่ต้องทำ ดำเนินการและเรียนรู้จากผลลัพธ์ 🚀
แพลตฟอร์มนี้อยู่ในช่วงเบต้า ณ ขณะนี้เรากำลังทำงานเพิ่มเติมที่:
- ความจำระยะยาว
- การเรียกดูเว็บ
- การแอบเข้าถึงเว็บไซต์และคน"
แท้จริงแล้ว จะมี Tweet จากผู้สร้างของ AgentGPT ที่อธิบายเพิ่มเติม:
"มันทำงานโดยใช้โมเดลในการสร้างรายการงานและดำเนินการทดลองเบื้องต้นกับงาน โดยประเมินว่างานได้รับการดำเนินการเรียบร้อยหรือต้องมีการดำเนินการย่อยเพิ่มเติม"
"ในอนาคตเราจะมีหน่วยความจำระยะยาวผ่าน @pinecone และรุ่นโมเดลจะมีความสามารถในการสอบถามข้อมูลบนเว็บ..."
![รูปภาพ2.png](https://static-lib.s3.amazonaws.com/cms/image2_174c51e72a.png)
Godmode AI
หนึ่งในอินเตอร์เฟซ AI ล่าสุดคือชื่อเรียก Godmode
ในการใช้งาน ต้องสร้างงานก่อน
อินเทอร์เฟซจะตอบสนองด้วยข้อเสนอให้ใช้งานที่นิยามงานนั้น
การเลือกหนึ่งในข้อเสนอที่เราได้รับ จะเปิดใช้งานตัวแทนปัญญาประดิษฐ์ที่เริ่มทำงานของมัน
Godmode ต้องการเข้าสู่ระบบด้วยบัญชี Google, GitHub หรือ Twitter
ในขณะนี้ใช้การใช้งานโหมดพระเจ้าไม่ต้องใช้คีย์ API จาก OpenAI เพื่อให้การทำงาน แต่การใช้คีย์ API จะเพิ่มกำลังการทำงานของ GPT-4 เข้าสู่ผลลัพธ์ของโหมดพระเจ้า
![ภาพ1.jpg](https://static-lib.s3.amazonaws.com/cms/image1_21bc8a06c3.jpg)
ตัวแทน AI อัตโนมัติ
บางคนกำลังตกใจกับ ChatGPT อยู่
แต่ตัวอักษร AI อิสระเช่น Auto-GPT เปิดเผยว่าสินค้าของ OpenAI สามารถทำอะไรได้มากกว่านั้น
การพัฒนาตัวแทน AI ที่ไม่ต้องการควบคุมเองเป็นสิ่งใหม่และล้ำค่า มันถูกสร้างขึ้นโดยนักพัฒนาและไม่ใช่ บริษัทใหญ่เช่น OpenAI และ Google
เทคโนโลยีเหล่านี้ยังเป็นเทคโนโลยีที่อยู่ในขั้นตอนการทดลองและเบต้า แต่มีบางส่วนที่เสถียรพอที่จะทำภารกิจที่น่าประทับใจในระดับที่คนต้องการจากมนุษย์ได้
เทคโนโลยีเช่น Auto-GPT ทำให้ง่ายต่อการจินตนาการถึงจุดหนึ่งที่นายจ้างสามารถจ้างหนึ่งคนที่จะมอบหมายงานให้กับตัวแทนปัญญาประดิษฐ์เพื่อทำงานแทนสำหรับพนักงานทั้งห้าคน
ไม่ยากที่จะนึกภาพเวลาที่นายจ้างสามารถปล่อยตัวแทน AI ที่จัดการตัวแทน AI โดยไม่ต้องมีผู้ควบคุมมนุษย์อีกต่อไป