LLM Series: Membuat Perangkum Dokumen Sederhana

Salam Devs, Apa kabar ? semoga sehat dan tetap senyum walaupun katanya lagi tech winter ;D

Kali ini penulis membuat tools sederhana dengan memanfaatkan kapabilitas dari LLM ? apa itu ? Large Language Model, simpelnya model yang dipake buat bikin ChatGPT ya salah satu contoh dari LLM, GPT3.5/GPT4.

Secara sederhana tool ini akan jalan di command line, dan akan menerima parameter berupa folder path yang berisi dokumen word, pdf atau teks yang ingin di rangkum isinya. Lalu rangkumannya akan disimpen ke dalam teks file di folder yang sama. Simpel khan ?

Nah apa yang kita butuhkan ? Kita tahu Chat GPT punya kemampuan untuk melakukan perangkuman kata. Nah gimana supaya kita dapat manfaatkan kemampuan itu ? Nah kita bisa gunakan API Open AI, walaupun temen-temen bisa panggil langsung tapi kali ini penulis sekalian memperkenalkan library orkestrasi AI buatan Microsoft yaitu Semantic Kernel. Apa itu ? simpelnya LangChain versi Microsoft haha, atau library open source untuk menggabungkan kapabilitas LLM dengan koding teman-teman. Intinya kita bisa manfaatin kemampuan LLM dalam aplikasi kita.

Penjelasan lebih jauh teman-teman baca aja dari sini ya: Orchestrate your AI with Semantic Kernel | Microsoft Learn

Nah saya lanjut ke praktek pemanfaatannya saja, silakan teman-teman buka projectnya dari repo: Gravicode/DocSummarizer: this is console app to summarize document in folder, ext support : pdf, word (github.com)

  1. Silakan buka projectnya dengan VSCode atau Visual Studio
  2. Pada file Summary Service terlihat jelas bagaimana kita menggunakan semantic function dari semantic kernel untuk melakukan summary teks.
  3. Yang pertama teman-teman inisiasi kernelnya dengan memasukan Key Open AI
  4. Selanjutnya kita bikin semantic functionnya seperti dibawah ini, terlihat kita membuat prompt dengan natural language untuk merangkum teks, ini yang membedakan koding semantic dan syntactic ala koding biasanya.
  5. Lalu kita panggil fungsinya dengan cara seperti ini
  6. Terlahir kalau kita jalankan aplikasinya seperti ini
  7. Penulis memang tidak menjelaskan cara kerja membaca file dari folder, atau mengekstraksi teks dari dokumen, atau memanfaatkan parallel processing di koding utama, penulis yakin temen-temen uda lebih paham.
  8. Semoga bermanfaat dan berkarya terus ;D

Loading

You May Also Like