LLM สมองบิน EP.7 — Prompt Engineering ระดับพระกาฬ

สวัสดีค่าาา กลับมาสรุปเลคเชอร์ทรงคุณค่าที่เราเจอใน youtube โดยบังเอิญกันต่อ จากตอนที่แล้วที่เราพูดถึงการทำ Prompt Engineering สำหรับการทำ evaluation ไปแล้ว ต่อไปมาดูว่าการ prompt เทพเซียน ที่ระดับตัวตึงเขาเขียนกันสำหรับโมเดลใหม่ๆ เขาทำท่าไหนกันบ้าง

  1. บอกว่าต้องการ output แบบไหน JSON XML หรือ template ที่ต้องการ อย่างโปรเจคที่ บ. เราก็มี use case ที่แบบลูกค้าต้องการให้ออกมาเป็นหน้ารายงาน มีข้อมูลเป็นๆข้อๆ หนึ่งสองสามสี่ เราก็ต้องมา prompt โมเดลดีๆว่าเราต้องการแบบไหน
Source: https://youtu.be/HqLf1Cvco2k?si=Dt8AMbL0u3AJtmix

2. สำหรับ task ที่ต้องการให้โมเดลช่วยวิเคราะห์อะไรซับซ้อนๆ ก็จะให้มันคิดก่อนตอบ หรือเรียกว่า chain of thought (เป็นท่าสมัยก่อน แรงมากแม่ 5555 สมัยก่อนที่เท่ากับปีที่แล้ว) ทำได้ 3 แบบ

  • ให้มันคิดเป็นเสต็ป
  • บอกขั้นตอนเลย หนึ่งสองสามสี่ พร้อมยกตัวอย่าง
  • ใช้ XML ให้ prompt เป็น structured มี <thinking> กับ <answer> เพื่อแยก

ข้อเสียคือ ช้า และ เปลือง แต่ปัจจุบันโมเดลสมัยใหม่มันมี reasoning ในตัวอยู่แล้ว

3. ใส่ Persona เข้าไป เหมือนเวลาทำ design thinking 555 มันคือการบอกโมเดลว่า เธอเป็นใคร ทำหน้าที่อะไร อันนี้จะใส่ใน system prompt เช่น “You are a data scientist at a financial institution.”

4. Prefill ทำได้เฉพาะ API มันคือการเตรียมคำพูดให้โมเดล เช่นทักทาย user สวัสดีครับ ยินดีต้อนรับสู่ระบบคนละครึ่ง หรือ เตรียมรูปแบบการตอบ

5. Chain complex prompts คือการแบ่ง task ออกเป็น task ย่อย โดยให้1 prompt ต่อ 1 function ยกตัวอย่าง

Source: https://youtu.be/HqLf1Cvco2k?si=mBsJEYLpFDxPjgL-

เราจะเห็นว่า prompt นึงจะสั่งงานอย่างนึง แล้วเอาไปทำต่อ

อีกตัวอย่างนึง เป็นแบบ self-correction chains

Source: Source: https://youtu.be/HqLf1Cvco2k?si=mBsJEYLpFDxPjgL-

Prompt แรกให้สรุป paper แล้ว prompt ที่ 2 ให้ feedback ที่สรุปมาจาก prompt ตะกี้ และก็ prompt 3 ไปอัปเดตการสรุปจาก feedback ก่อนหน้า วนไป

ข้อเสียคือเรื่องความเปลือง และ latency อีกแล้ว ก็ต้องมา exercise judgement ว่าคุ้มไหมที่จะแลก

ส่วนประกอบของ prompt ก็หน้าตาประมาณนี้ มาเป็นช่องเจ็ดสี ทีวีเพื่อคุณเลย 55555

ส่วนตัวเราว่าอันนี้ดีมาก เป็น guide ที่เราได้เอาไปใช้จริงๆ

Source: https://youtu.be/HqLf1Cvco2k?si=F2umEk2FMc9aWpgA

สำหรับข้อ 3 สีส้มๆ เดี๋ยวครั้งหน้าเราจะมาลงรายละเอียดกันในเรื่องของ RAG นะจ๊ะ

Prompt Engineering vs. Fine Tuning ควรทำอะไรดี

คนที่ทำ machine learning/ deep learning มาก่อนก็อาจจะตอบว่า ก็ต้อง fine tune สิคร้าบบบบ แต่จริงๆแล้วการ fine tune มันก็ costly ซึ่งควรเอาเป็นตัวเลือกสุดท้ายถ้าหมดหนทางแล้วถึงค่อยมาทำ อาจจะขัดใจแต่ก็ต้องยอมรับว่าโมเดลมันเก่งมากๆแล้ว วางอัตตาลงแล้วไปทำ prompt engineering ให้ดีแล้วกัน 5555

ต่อไปเราจะมาดูว่าบริษัทใหญ่ๆเค้าเขียน prompt กันยังไง

และนี่คือ System Prompt ของโมเดล Claude 3

รูปข้างบนของตัวอย่าง system prompt ของโมเดล Claude 3 เขียนโดยเจ้าแม่ Amanda Askell ใน X ซึ่งขุ่นแม่ก็ได้ breakdown ว่าเขียนยังไง ไปอ่านเองในนี้ได้เลย เพราะขี้เกียจเขียน 55555 ยาวอ่ะ

ส่วนของ Claude 4 ไปดูใน X ของขุ่นแม๊ได้เลย ไม่เขียนแล้ววว เยอะเกินนน

ส่วน System prompt ของ Claude ทั้งหมด ไปดูในนี้ได้เลย

ต่อไปเป็นตัวอย่าง Use cases ที่ใช้ในชีวิตจริง เวลาไป deploy ขึ้นเป็น production

  • Classification: ใช้โมเดล LLM ทำก็ได้นะเออ ถ้าเราไม่มี pattern หรือขาดแคลนเฉลย ก็ทำเป็น few shot learning ได้ หรือ task ยากๆแล้วซีเรียสกับ accuracy ถ้ายอมรับกับ cost ได้ ก็ใช้ LLM ทำได้
Source: https://youtu.be/HqLf1Cvco2k?si=DyzeehLC_lFcxc4Q

ตัวอย่างการ prompt การทำ classification task ที่เป็น structure ตามสีรุ้งกินน้ำที่แปะไว้ข้างบนเลย อะไรเป็นอะไรบ้างย้อนขึ้นไปดูได้ เราก็เลื่อนขึ้นลงดูตาแตกเหมือนกัน 5555

  • ต่อไปเป็น Claude Prompt Generator เป็นการ prompt เพื่อสร้าง prompt อีกที 55555 ใครสนใจแงะ ไปดูได้ที่นี่เลย จริงๆมันก็คือเขียนตาม structure รุ้งกินน้ำแหละ แต่เขียนให้มันช่วยเราเขียน prompt อีกทีนึง
  • OpenAI Study Mode คือแทนที่จะเฉลยมาเลย ก็จะสอนเป็นขั้นตอนให้เราคิดเองก่อน ส่วน system prompt ไปดูได้ที่นี่
  • Github Spark สาย vibe coding ห้ามพลาด 5555 ไปแงะ system prompt ได้ แต่ยาวมากกกก ถ้าปริ้นออกมาน่าจะได้หนังสือมารองขาโต๊ะอ่ะ

Model Specific Prompting

โมเดลแต่ละค่ายก็จะมีการ prompt ไม่เหมือนกัน แต่โมเดลใหม่ๆจะฉลาดขึ้น เราบอกอะไรมัน มันเก็บทุกเม็ด หมายความว่าต้อง prompt ให้ดีๆ สั่งให้ละเอียด context ต้องอธิบาย

ส่วน Cluade เลี่ยงการบอกว่า Do not แต่ต้องบอกว่าต้องทำอะไร หรือใช้คำว่า avoid หรือจริงๆก็เปลี่ยนประโยคไม่ให้เป็น negative เลยดีกว่า

ของ OpenAI เริ่มจาก intruction อธิบาย task ขั้นตอน อะไรไม่ควรทำ แล้วก็ระวังอะไรที่มันย้อนแย้งในตัวเอง 5555 แล้วก็ยกตัวอย่าง

สุดท้าย โมเดล Reasoning มันเป็น high level แล้ว อารมณ์พนักงานอาวุโส ก็ไม่ต้องอธิบายมาก แค่ brief แล้วบอกเป้าหมายก็ได้ อ่านต่อได้ที่นี่ มาสรุปให้ฟังด้วย 5555

หมดแล้วววว ปิดท้ายด้วย GPT-5 Prompt Optimizer ไปลองเล่นได้

จบไปแล้วกับ LLM สมองบินนนนน ตอนนี้ปวดหมองมากก 5555 หวังว่าจะเป็นประโยชน์นะคะ และขอบคุณความรู้ดีๆจากอาจารย์นัทด้วยค่ะ

แล้วเจอกันใหม่ตอนหน้า จะได้สรุป RAG แล้ววว เย้ๆ

ขอบคุณที่ติดตามนะคะ ฝาก IG: @chaofitchick ไปตามดูเราออกกำลังกายซ้อมแข่ง Hyrox ได้ อิ__อิ