LLM Series: Analyzing Video using LLMs

177 views
1 minute read

ByMuhammad Ibnu Fadhil
October 12, 2024

Salam Rekan Dev,

Weekend begini biasanya mager, tapi coba kita sempetin nulis dikit. Kali ini tentang bagaimana memanfaatkan LLM untuk analisa video.

Jadi kita manfaatkan LLM multi-modal untuk bisa memproses frame dari video. Supaya ga boros ya jangan semua frame, kita ambil beberapa frame yang mewakili scene yang sedang terjadi.

Oke cara kerjanya kurang lebih seperti ini:

Buka video
Extract frame gambar dari video
Sesuaikan ukuran dan tipe gambar yang bisa dihandle LLM Model
Sesuaikan prompt dan system prompt agar menghasilkan analisa yang baik

Oke tenang aja semua sudah dibuatkan jadi library dan demo app, temen-temen kalau mau coba silakan:

Download reponya dari https://github.com/Gravicode/LLMVideoAnalyzer
Buka dengan visual studio
Sesuaikan konfigurasi LLM yang mau dipakai, buka file app.config, sesuaikan.
Run project, pilih video yang mau di analisa.. sebagai bonus tak tambah fitur untuk extract video dari webcam dan cctv/web video url ke frame.

Saat ini support untuk: open ai, ollama, azure open ai dan github model.

Selamat berkarya, moga manfaat.

Salam Developer ;D

Related Tags

Muhammad Ibnu Fadhil

Penulis kode, pedagang aplikasi perkantoran, implementator integrasi sistem, memiliki UKM yaitu gravicode.com, mendirikan komunitas kecil gadgeteer Indonesia, mendedikasikan diri untuk membangun produk dan jasa yang bermanfaat untuk ummat terutama di bidang teknologi informasi.