Agentic AI: Apa Maksudnya untuk Enterprise Malaysia dan Bila Anda Perlu Melaburkan
Penjelasan teknikal tentang agentic AI untuk CTO dan Head of AI di Malaysia — planning loops, tool use, multi-step reasoning, dan bila pendekatan agentic lebih baik berbanding single-shot LLM.
Chandra Rau
Founder & CEO
Dalam tempoh 12 bulan kebelakangan ini, istilah "agentic AI" telah berpindah daripada perbincangan akademik ke bilik mesyuarat enterprise Malaysia. CTO dan Head of AI di GLC, bank dan syarikat manufacturing tier-1 kini menerima cadangan vendor yang mendakwa boleh autonomi sepenuhnya menggantikan workflow manual menggunakan AI agents. Tetapi di sebalik hype tersebut, terdapat realiti teknikal yang lebih bernuansa: agentic AI adalah satu paradigma yang berkuasa untuk kelas masalah tertentu, dan satu pelaburan yang mahal dan berisiko untuk kelas masalah yang lain.
Artikel ini ditujukan kepada pembuat keputusan teknikal — CTO, Head of AI, Principal Engineer — yang perlu memahami secara mendalam apa itu agentic AI, bila ia merupakan pilihan yang betul, dan bila pendekatan yang lebih ringkas seperti single-shot LLM call atau pipeline RAG tradisional akan memberikan throughput, latency dan kos yang lebih baik. Kami tidak akan mengulangi definisi marketing. Sebaliknya, kami akan meneroka mekanisme dalaman, tradeoff operasi, dan kriteria keputusan yang kami gunakan dalam engagement TechShift dengan enterprise Malaysia.
Apa Sebenarnya Agentic AI: Planning Loops dan Tool Use
Pada teras teknikalnya, sistem agentic AI adalah seni bina yang menggabungkan large language model (LLM) sebagai reasoning engine dengan satu set tools yang boleh dipanggil, satu memory layer (sama ada short-term context atau long-term vector store), dan satu planning loop yang mengulangi cycle observe-think-act sehingga tugasan selesai. Berbeza dengan single-shot LLM call di mana anda menghantar satu prompt dan menerima satu response, agent boleh memutuskan untuk memanggil tool X, melihat hasilnya, kemudian memutuskan untuk memanggil tool Y, kemudian merefleksikan jika ia perlu memulakan semula — semuanya dalam satu execution.
Framework yang sering muncul dalam perbincangan ini termasuk LangGraph (graph-based agent orchestration daripada LangChain), CrewAI (multi-agent collaboration pattern), AutoGen daripada Microsoft Research (conversation-based agent framework), dan OpenAI Assistants API. Setiap satunya menawarkan abstraction yang berbeza untuk menguruskan kompleksiti agentic workflow. TechShift tidak menyokong atau menentang mana-mana framework tertentu — pilihan bergantung kepada kekangan integrasi, kemahiran team, dan keperluan governance organisasi anda.
Komponen utama yang mentakrifkan sistem agentic ialah planning loop. LLM tidak hanya menjawab — ia memutuskan langkah seterusnya. Dalam pattern ReAct (Reason + Act) yang menjadi asas kepada kebanyakan agent moden, model mengeluarkan thought yang menjelaskan apa yang ia mahu lakukan, kemudian action yang memanggil tool, kemudian menerima observation daripada tool tersebut, dan mengulangi cycle ini. Pattern Plan-and-Execute yang lebih canggih memisahkan fasa planning daripada fasa execution, membolehkan agent mengeluarkan rancangan multi-step yang utuh sebelum melaksanakannya.
Tool Use: Di Mana Nilai Sebenar Wujud
LLM standalone hanya boleh menjana teks. Agent menjadi berguna apabila ia boleh memanggil tools — function yang melakukan kerja sebenar dalam sistem anda. Tools tipikal dalam enterprise Malaysia termasuk: query kepada vector database untuk RAG (Pinecone, Weaviate, Qdrant atau pgvector), panggilan API kepada CRM (Salesforce, HubSpot), query SQL kepada data warehouse, panggilan ke ERP (SAP, Oracle), penghantaran mesej WhatsApp Business API, panggilan kepada model ML lain yang khusus (contohnya, model fraud detection custom anda), atau bahkan eksekusi kod dalam sandbox.
Cabaran teknikal di sini bukanlah membina tool — itu bahagian yang mudah. Cabaran adalah memastikan agent memilih tool yang betul, dengan argument yang betul, pada masa yang betul. Dalam pengalaman kami, kadar pemilihan tool yang salah oleh model frontier (GPT-4 class, Claude Sonnet class) untuk kes penggunaan enterprise yang spesifik adalah sekitar 5-15% tanpa fine-tuning atau prompt engineering yang teliti. Untuk workflow kewangan atau perubatan di mana kesilapan adalah mahal, ini tidak mencukupi.
Bila Pendekatan Agentic Adalah Pilihan Yang Betul
Pendekatan agentic memberikan nilai tertinggi apabila tugasan mempunyai tiga ciri ini secara serentak. Pertama, tugasan tersebut memerlukan penyusunan langkah yang dinamik — bilangan dan urutan tindakan tidak boleh ditentukan terlebih dahulu kerana ia bergantung kepada keputusan separa. Kedua, terdapat banyak tools yang berkaitan dan model perlu memilih subset yang relevan. Ketiga, kos kegagalan adalah sederhana dan pulih (recoverable) — ini bukan transaksi RM10 juta yang tidak boleh diundurkan.
- /Penyiasatan customer support yang kompleks: agent boleh memeriksa CRM, log tiket sebelumnya, status pesanan, dan resolusi bayaran sebelum merangka response
- /Lead qualification yang bernuansa: agent menyemak LinkedIn, syarikat dalam senarai SSM, sejarah engagement, dan tahap pendedahan untuk memberikan skor lead dengan justifikasi
- /Penyusunan laporan analitik ad-hoc: agent memilih jadual yang relevan, menulis query SQL, mentafsir hasil, dan menjana visualisasi atau narrative
- /Multi-document research dalam legal atau finance: agent merentasi puluhan dokumen, mengekstrak fakta yang berkaitan, dan menyusun ringkasan dengan citation
- /Automasi DevOps pemulihan diri: agent menyiasat alert, query logs, mencuba pembaikan standard, dan eskalasi kepada manusia jika gagal
Bila Anda TIDAK Perlu Agentic AI
Realiti yang jarang dibincangkan oleh vendor: kebanyakan kes penggunaan AI enterprise tidak memerlukan agent. Jika tugasan anda boleh diselesaikan dengan single LLM call yang ditambah dengan retrieval (pattern RAG tradisional), itu adalah pilihan yang lebih murah, lebih pantas, dan jauh lebih mudah untuk dimonitor. Cost-per-token agentic workflow biasanya 3-10 kali ganda berbanding single-shot kerana setiap langkah dalam planning loop adalah satu LLM call yang berasingan, masing-masing dengan context window yang berkembang.
Latency adalah masalah yang lebih besar. Single-shot RAG call biasanya selesai dalam 2-5 saat. Agentic workflow dengan 5-10 tool calls boleh mengambil masa 30-90 saat. Untuk experience customer-facing seperti chatbot, ini tidak dapat diterima. Kebolehpercayaan juga merosot dengan setiap langkah tambahan — jika setiap langkah mempunyai 95% kadar kejayaan, workflow 10-langkah hanya mempunyai kadar kejayaan keseluruhan sekitar 60%.
"Pelaburan agentic AI yang gagal biasanya bermula dengan masalah yang sepatutnya diselesaikan dengan RPA atau workflow engine tradisional. Tambahkan LLM hanya apabila ada keperluan untuk reasoning yang fleksibel — bukan untuk menjadikan automation kelihatan moden."
— Principal Engineer, bank tier-1 Malaysia
Realiti Kos dan Kebolehpercayaan untuk Enterprise Malaysia
Mari kita bercakap tentang nombor sebenar. Satu workflow agentic yang menggunakan GPT-4-class atau Claude Sonnet untuk reasoning, dengan purata 6 tool calls per task dan 8,000 token context window per call, akan kos sekitar USD 0.40-0.80 per task. Untuk 10,000 task setiap hari, ini bersamaan RM 17,000-34,000 sebulan hanya untuk inference. Tambah pula kos infrastruktur (vector DB, observability, guardrails, fallback model) dan kos engineering untuk monitoring dan iterasi, anda biasanya melihat total cost of ownership RM 80,000-150,000 sebulan untuk produksi single-agent berskala sederhana.
Untuk MDEC MyAI Sandbox participants dan syarikat yang mengejar GITA tax incentive, structuring pelaburan agentic AI sebagai capex melalui pembinaan kapasiti dalaman (internal platform team, observability stack, evaluation harness) memberikan layanan cukai yang lebih baik berbanding opex pure SaaS. Ini adalah perbincangan yang patut anda adakan dengan CFO dan firma cukai anda sebelum komited kepada vendor agent platform.
TechShift bekerja dengan beberapa enterprise Malaysia dalam fasa agentic AI mereka. Pendekatan kami selalu bermula dengan persoalan: bolehkah masalah ini diselesaikan tanpa agent? Jika ya, kami mengesyorkan pendekatan yang lebih ringkas. Jika tidak, kami mereka bentuk sistem dengan boundary yang ketat, evaluation harness yang kuat, dan kos throttling yang transparen. Untuk perbincangan strategi AI yang lebih luas, sila rujuk halaman khidmat AI Strategy kami atau lihat perkhidmatan AI Integration untuk butiran implementasi.
Soalan Strategik Sebelum Melaburkan
Sebelum anda meluluskan bajet untuk inisiatif agentic AI, jawab lima soalan ini secara jujur dengan team teknikal anda. Jika anda tidak dapat menjawab ya yang munasabah untuk sekurang-kurangnya empat daripada lima, anda mungkin belum bersedia.
- /Adakah anda mempunyai evaluation harness yang mengukur kebolehpercayaan workflow secara end-to-end, bukan hanya quality response LLM individu?
- /Adakah team anda mampu untuk operasi observability stack (tracing, prompt logging, cost monitoring) yang akan menjana data telemetri yang ratusan kali lebih besar daripada microservices biasa?
- /Adakah workflow yang anda automatkan benar-benar tidak boleh diselesaikan dengan RPA atau LLM single-shot yang lebih murah dan lebih dipercayai?
- /Adakah anda mempunyai prosedur fallback dan eskalasi manusia yang jelas untuk apabila agent gagal atau memberikan output yang salah?
- /Adakah governance framework anda (PDPA, BNM RMiT jika relevan) telah disemak untuk menangani kompleksiti audit trail bagi multi-step LLM reasoning?
Jika anda ingin membincangkan kes spesifik organisasi anda atau memerlukan penilaian kesediaan agentic AI, hubungi pasukan kami melalui halaman hubungi kami atau lihat keseluruhan pendekatan kami di laman AI consulting Malaysia.
Soalan Lazim
Apakah perbezaan utama antara agentic AI dan chatbot biasa?
Chatbot biasa menggunakan single LLM call atau pipeline RAG tetap — input masuk, output keluar dalam satu langkah. Agentic AI menggunakan planning loop di mana model membuat keputusan dinamik tentang tools mana untuk dipanggil, dalam urutan apa, dan bila untuk berhenti. Ini memberikan fleksibiliti untuk tugasan kompleks tetapi meningkatkan kos, latency dan kompleksiti operasi secara signifikan.
Adakah framework seperti LangGraph atau CrewAI siap untuk produksi enterprise?
Framework ini matang untuk prototaip dan pilot, tetapi production deployment masih memerlukan kerja engineering yang signifikan untuk observability, error handling, cost control, dan integrasi keselamatan. Kami melihat keberjayaan apabila team menggunakan framework sebagai titik permulaan tetapi melabur dalam internal platform team untuk operasi jangka panjang.
Berapa lama untuk mendapatkan agentic AI workflow ke production?
Untuk use case yang jelas dan kompleksiti sederhana, 12-16 minggu daripada PoC hingga production yang stabil adalah realistik. Ini termasuk evaluation harness, observability, guardrails dan integrasi dengan sistem enterprise sedia ada. Vendor yang menjanjikan 4 minggu biasanya melompatkan komponen produktif.
Adakah agentic AI mematuhi PDPA Malaysia?
Pematuhan PDPA bergantung kepada bagaimana anda mengendalikan personal data dalam prompt, tools, dan logging. Audit trail untuk multi-step reasoning adalah lebih kompleks berbanding single API call dan memerlukan reka bentuk yang teliti. Cross-link kepada strategi data adalah penting — lihat artikel kami tentang strategi data untuk butiran lanjut.
Bila saya patut menggunakan model frontier vs model open-source untuk agent saya?
Model frontier (GPT-4-class, Claude Sonnet/Opus) memberikan kadar pemilihan tool yang lebih tinggi dan reasoning yang lebih baik, tetapi pada kos yang lebih tinggi. Model open-source (Llama 3, Mistral, Qwen) yang dijalankan pada GPU sendiri memberikan kawalan data dan kos marginal yang lebih rendah pada skala besar, tetapi memerlukan kerja prompt engineering dan kadang-kadang fine-tuning untuk mencapai tahap kebolehpercayaan yang sama.
Bagaimana cara mengukur ROI agentic AI?
Ukur penjimatan masa kakitangan untuk tugasan yang diautomatkan, kadar kejayaan workflow berbanding baseline manual, dan kos inference penuh termasuk pembaikan kegagalan. Hindari metrik task completed tanpa quality gating — agent boleh menyelesaikan task tetapi dengan output yang salah. ROI sebenar muncul apabila workflow stabil pada lebih 95% kadar kejayaan dengan minimum supervision manusia.