ㅤ
สำหรับ Cognition อนาคตของวิศวกรรมซอฟต์แวร์ไม่ใช่เกมแบบผลรวมเป็นศูนย์ระหว่างวิศวกรมนุษย์กับเอเจนต์ AI แต่เป็นการทำงานร่วมกันระหว่างมนุษย์และ AI ที่ดึงจุดแข็งของแต่ละฝ่ายมาใช้เพื่อสร้างทีมวิศวกรรมที่มีประสิทธิภาพและทรงพลังยิ่งขึ้น
สก็อตต์ วู เป็นผู้ร่วมก่อตั้งและ CEO ของ Cognition เขาเติบโตในรัฐหลุยเซียนาและมีพรสวรรค์ด้านคณิตศาสตร์และการเขียนโปรแกรม วูเข้าร่วมการแข่งขันคณิตศาสตร์ครั้งแรกในชั้นประถมศึกษาปีที่ 2 และเรียนรู้การเขียนโปรแกรมเมื่ออายุ 12 ปี เขาได้รับเหรียญทอง 3 เหรียญจากการแข่งขันโอลิมปิกนานาชาติสาขาคอมพิวเตอร์ และเป็นแชมป์ในการแข่งขัน MATHCOUNTS ในปี 2011 ขณะเรียนอยู่ในมหาวิทยาลัย เขาเป็นตัวแทนของมหาวิทยาลัยฮาร์วาร์ดในการแข่งขันเขียนโปรแกรมระดับมหาวิทยาลัยนานาชาติปี 2016 เขาได้ก่อตั้งบริษัทแรกของเขาในปี 2017 นั่นคือ Lunchclub ซึ่งเป็นแพลตฟอร์มเครือข่ายที่ขับเคลื่อนด้วย AI หลังจากออกจาก Lunchclub ในปี 2022 เขาได้ร่วมก่อตั้ง Cognition ขึ้น
เมื่อเร็วๆ นี้ เราได้สัมภาษณ์คุณวูในพอดแคสต์ Cheeky Pint ของเรา ในที่นี้ เราได้ตัดตอนบางส่วนจากการสนทนานั้นมาเพื่อเน้นย้ำความคิดเห็นของเขาเกี่ยวกับสถานการณ์ปัจจุบันของการเขียนโค้ด AI และผลกระทบที่อาจเกิดขึ้นจากเอเจนต์ AI ต่อบทบาทของวิศวกรรมซอฟต์แวร์แบบดั้งเดิม นอกจากนี้ เรายังได้ฟังความคิดเห็นของเขาเกี่ยวกับแนวโน้มการเติบโตโดยรวมของอุตสาหกรรม AI วิดีโอสัมภาษณ์นี้ได้รับการตัดต่อเพื่อความกระชับและชัดเจน หากต้องการชมตอนเต็ม คลิกที่นี่
ช่วยเล่าเรื่องของ Devin ให้เราฟังหน่อย อะไรที่ทำให้เอเจนต์เขียนโค้ด AI ของคุณแตกต่างจากผู้ช่วยเขียนโค้ดที่มีอยู่แล้ว
วู: ในระดับภาพรวม เราต้องการสร้างอนาคตของวิศวกรรมซอฟต์แวร์
ที่ผ่านมาเรามีแนวทางการทำงานแบบ IDE อย่าง GitHub Copilot ที่เป็นตัวอย่างที่หลายคนรู้จัก ซึ่งก็คือการที่คุณนั่งพิมพ์โค้ดอยู่ที่คีย์บอร์ดแล้วผู้ช่วยก็เข้ามาช่วยให้คุณทำงานได้เร็วขึ้นเล็กน้อย พร้อมทั้งมีเครื่องมือและทางลัดต่างๆ ให้ครบถ้วนตามที่คุณต้องการ
Devin เป็นรูปแบบการทำงานที่แตกต่างออกไปมากสำหรับสิ่งที่ผมเรียกว่าเป็นประสบการณ์แบบอะซิงโครนัส ซึ่งก็คือการที่คุณมีเอเจนต์แล้วและคุณมอบหมายงานให้เอเจนต์นั้น ดังนั้น Devin จะทำงานในระดับทิกเก็ตหรือระดับโปรเจกต์โดยธรรมชาติ เช่น คุณมีปัญหาอยู่ใน GitHub แล้วคุณก็แท็ก Devin ใน Slack หรือ Linear หรือ Jira จากนั้น Devin ก็จะเริ่มลงมือทำงานทันที
ปัจจุบัน Devin ทำงานด้านการพัฒนาเหล่านั้นได้ดีแค่ไหน
ตอนนี้เราเรียก Devin ว่าเป็นวิศวกรระดับจูเนียร์ เรามักจะเห็นผู้คนใช้ Devin กับงานอย่างเช่นการเพิ่มฟีเจอร์ง่ายๆ และการแก้ไขต่างๆ นอกจากนี้ Devin ยังทำงานที่ซ้ำๆ และค่อนข้างน่าเบื่อซึ่งมักเกิดขึ้นบ่อยในงานวิศวกรรม เช่น การย้ายระบบ การปรับให้ทันสมัย การรีแฟกเตอร์ การอัปเกรดเวอร์ชัน หรือการทดสอบและการจัดทำเอกสารประกอบ มันบ้ามากที่เวลาของวิศวกรซอฟต์แวร์จำนวนมากถูกใช้ไปกับเรื่องอย่างการแก้ปัญหาการปรับใช้ Kubernetes ของคุณ
ทุกองค์กรทั่วโลกกำลังพยายามทำความเข้าใจผลกระทบของการเขียนโค้ดด้วย AI มุมมองของคุณที่มีต่อขนาดของผลกระทบด้านประสิทธิภาพเป็นอย่างไร และผลกระทบด้านประสิทธิภาพเป็นสิ่งที่สามารถวัดได้จริงหรือไม่
วู: ได้ แน่นอน ผมคิดว่าการเปลี่ยนไปสู่การใช้เอเจนต์แบบค่อยเป็นค่อยไปจะช่วยได้มากอย่างที่เห็นกันอยู่ ด้วยเอเจนต์ ขั้นตอนการทำงานส่วนมากคือการที่เอเจนต์ทำงานให้คุณเลย ดังนั้น ถ้าเป็น Jira Ticket หรือการย้าย โดยปกติคุณจะพอประเมินได้อยู่แล้วว่าต้องใช้เวลาวิศวกรกี่ชั่วโมง ตอนนี้ เอเจนต์จะทำงานทั้งหมดให้แบบครบตั้งแต่ต้นจนจบ ผลกระทบจึงเห็นได้ชัดมากขึ้น เพราะคุณไม่ต้องมานั่งทำการย้ายเองอีกต่อไป คุณแค่รีวิว PR โดยใช้เวลาเพียง 5 นาที แล้วทุกอย่างก็เสร็จเรียบร้อย
ในระดับภาพรวม เราต้องการสร้างอนาคตของวิศวกรรมซอฟต์แวร์
ช่วยเล่าเกี่ยวกับเรื่องการเข้าซื้อกิจการ Windsurf ให้ฟังหน่อย ฉันเข้าใจว่าข้อตกลงเกิดขึ้นเร็วมาก
วู: เราได้ยินข่าวเกี่ยวกับข้อตกลงระหว่าง Google กับ Windsurf ในวันศุกร์ พร้อมๆ กับคนอื่นๆ จากนั้นเราก็ทักไปหา Windsurf ภายในเย็นวันนั้นแบบไม่ได้มีการนัดหมายล่วงหน้าและเริ่มคุยกัน และก็ได้ตระหนักว่า ถ้าจะทำอะไรสักอย่าง จะต้องพร้อมเดินหน้าภายในวันจันทร์
เราจึงพูดว่า “โอเค ถ้าเราจะเดินหน้าลองสำรวจเรื่องนี้กันจริงๆ เราต้องทุ่มเททั้งช่วงสุดสัปดาห์แบบไม่หยุด” เราตกลงกันแบบคร่าวๆ ได้ในวันเสาร์ จากนั้นในคืนวันอาทิตย์พวกเราก็อดหลับอดนอนทั้งคืนเพื่อเคลียร์เรื่องกฎหมาย และเราก็ลงนามข้อตกลงกันได้ในเช้าวันจันทร์เวลา 9:00 น. มันเป็นอะไรที่สนุกมาก
จากนั้นเราก็พบว่ามีความลงตัวที่ดีมาก เพราะทีมวิจัยหลักและทีมวิศวกรรมผลิตภัณฑ์ของ Windsurf ย้ายไปที่ Google ส่วนฟังก์ชันอื่นๆ ยังคงอยู่ครบทั้งหมด ขณะที่ฝั่ง Cognition ไม่ว่าจะมองในแง่ดีหรือไม่ เราทำได้ดีในการสร้างทีมวิจัยหลักและทีมวิศวกรรมผลิตภัณฑ์ขึ้นมา แต่ยังตามหลังอยู่เล็กน้อยในด้านการขยายฟังก์ชันอื่นๆ เรารู้ว่ามันมีอะไรที่น่าสนใจมากอยู่ตรงนั้น
อุตสาหกรรม AI ประกอบด้วยหลายเลเยอร์ที่ซ้อนกันอยู่ เริ่มตั้งแต่ศูนย์ข้อมูล ต่อมาคือห้องปฏิบัติการ และสุดท้ายคือเลเยอร์ของแอปพลิเคชัน เมื่อมองไปข้างหน้าอีก 5 หรือ 10 ปี เลเยอร์ไหนจะยิ่งแข่งขันกันดุเดือดขึ้น แล้วเลเยอร์ไหนจะมีการแข่งขันน้อยลง
วู: ทุกคนมักจะล้อเยาะผมทุกครั้งที่ผมพูดแบบนี้ แต่ผมคิดว่าทุกเลเยอร์จะไปได้สวย
มูลค่าจะเกิดขึ้นในทุกจุดที่มีความแตกต่างอย่างมีนัยสำคัญในแต่ละเลเยอร์ เช่น มีทั้ง NVIDIA และ TSMC และตราบใดที่ NVIDIA ยังต้องทำงานร่วมกับ TSMC และ TSMC ก็ยังต้องทำงานร่วมกับ NVIDIA ทั้ง 2 ก็จะยังคงไปได้ดีต่อไป คุณจะเห็นภาพแบบเดียวกันนี้ในเลเยอร์ถัดๆ ลงมาด้วย ผมมองว่าปัญหาที่ได้รับการแก้ไขในแต่ละเลเยอร์เหล่านี้เป็นคนละแบบกันอย่างชัดเจน และมีความแตกต่างที่มีนัยสำคัญอยู่มาก
ยกตัวอย่างเช่น สิ่งเดียวที่ Cognition ให้ความสำคัญคือการสร้างอนาคตของวิศวกรรมซอฟต์แวร์ ดังนั้น ทุกคนต่างก็มี DNA ของตัวเอง และมีสิ่งที่ตัวเองถนัดที่สุดแตกต่างกันไป
ยกตัวอย่างเช่น สิ่งเดียวที่ Cognition ให้ความสำคัญคือการสร้างอนาคตของวิศวกรรมซอฟต์แวร์ ดังนั้น ทุกคนต่างก็มี DNA ของตัวเอง และมีสิ่งที่ตัวเองถนัดที่สุดแตกต่างกันไป
ฉันอยากทราบว่าคุณคิดว่าโครงสร้างพื้นฐานระบบเศรษฐกิจสำหรับ AI ควรมีลักษณะอย่างไร
วู: เรื่องใหญ่แน่นอนคือการเปลี่ยนจากการคิดค่าบริการแบบต่อผู้ใช้งานไปเป็นการคิดตามการใช้งานจริง อีกประเด็นสำคัญที่คิดออกก็คือจะเกิดเศรษฐกิจเอเจนต์ขึ้นมาอย่างเต็มรูปแบบ
เราสั่ง DoorDash ผ่าน Devin เราสั่งของจาก Amazon ด้วย Devin เราแค่ต้องอยู่ใน Slack แล้วพิมพ์ว่า “เฮ้ @Devin ช่วยไปซื้อไวท์บอร์ดเพิ่มให้หน่อยได้ไหม” อีกเคสสนุกๆ คือเราให้ Devin ไปเจรจากับสายการบินเพื่อขอเงินคืนจากเที่ยวบินที่ถูกยกเลิก Devin แชตกับเอเจนต์ของเว็บไซต์อยู่พักหนึ่ง แล้วสุดท้ายก็บอกว่า “แบบนี้ไม่เวิร์ก ฉันต้องคุยกับมนุษย์จริงเดี๋ยวนี้” แล้ว Devin ก็ได้เงินคืนสำเร็จ
ทุกวันนี้มีเอเจนต์เข้ามาใช้งานเว็บมากขึ้นเรื่อยๆ แต่ที่ผ่านมาแนวทางการทำงานหลักยังมีข้อจำกัดหลายอย่างที่ระบบไม่อนุญาตให้สิ่งที่ไม่ใช่มนุษย์ทำ ต่อจากนี้ เราน่าจะต้องเห็นการมอบอำนาจหรือการให้สิทธิ์แทนผู้ใช้มากขึ้นเพื่อทำให้ระบบเข้าใจอย่างชัดเจนว่าเอเจนต์สามารถทำสิ่งต่างๆ ในนามของคุณได้
คุณจะจ้างวิศวกรคนสุดท้ายเมื่อไร
วู: เป็นคำถามที่ดี ผมขอแยกประเด็นนิดหนึ่ง คือผมคิดว่าจะมีจุดหนึ่ง น่าจะอีกประมาณ 2–4 ปีจากนี้ ที่เราจะเลิกใช้โค้ดเป็นอินเทอร์เฟซหลัก พูดง่ายๆ ก็คือ การเป็นวิศวกรซอฟต์แวร์จะกลายเป็นแค่การบอกคอมพิวเตอร์ว่าให้ทำอะไรเท่านั้นเอง
คุณหมายความว่า อีก 2–4 ปีจากนี้ วิศวกรซอฟต์แวร์จะไม่ต้องมานั่งดูโค้ดในงานประจำวันแล้ว เหมือนกับที่ทุกวันนี้เราแทบไม่ต้องไปยุ่งกับภาษาแอสเซมบลีใช่ไหม
วู: ถูกต้อง วิศวกรซอฟต์แวร์จะยังคงต้องตัดสินใจในเชิงสถาปัตยกรรมจำนวนมาก แต่ในสถานการณ์ส่วนใหญ่จะไม่ได้ลงไปดูโค้ดด้วยตัวเอง เมื่อถึงจุดนั้น แน่นอนว่าลักษณะงานจะเปลี่ยนไปมาก แต่ถ้าให้มองอีกมุมหนึ่ง ผมคิดว่าเราจะมีวิศวกรซอฟต์แวร์มากขึ้นอย่างมาก ไม่ใช่น้อยลง
ทุกคนพูดถึงปฏิทรรศน์เจวอนส์ (Jevons Paradox) และความเกี่ยวข้องของปฏิทรรศน์นั้นกับ AI โดยปฏิทรรศน์นั้นเป็นจริงอย่างยิ่งในวงการซอฟต์แวร์ เพราะดูเหมือนว่าความต้องการโค้ดและซอฟต์แวร์ใหม่ๆ จะไม่มีวันหมดไป
ทุกคนพูดถึงปฏิทรรศน์เจวอนส์ (Jevons Paradox) และความเกี่ยวข้องของปฏิทรรศน์นั้นกับ AI โดยปฏิทรรศน์นั้นเป็นจริงอย่างยิ่งในวงการซอฟต์แวร์ เพราะดูเหมือนว่าความต้องการโค้ดและซอฟต์แวร์ใหม่ๆ จะไม่มีวันหมดไป