Carrot2: Kakas Pengelompokan Teks

Karena kebutuhan untuk bermain-main dengan teks berkaitan dengan Tugas Akhir saya, akhirnya saya terpaksa untuk mengeksplorasi Carrot2. Kakas ini sangat menarik sejatinya, karena bisa mengelompokkan teks dalam topik-topik tertentu. Salah satu bagian yang paling menarik adalah kemampuannya untuk melakukan visualisasi seperti gambar yang disertakan di bawah ini. Visualisasi tersebut didapatkan dengan query “Barack Obama”.

Nah, Carrot2 ini dapat diubahsuaikan untuk melakukan pengelompokan berdasarkan sumber tertentu, misalnya Twitter dalam kasus saya. Namun, sebetulnya selama bisa mendapatkan benda-benda berupa umpan (feed) dari sumber yang diinginkan sih, pengelompokan akan bisa dilakukan. Oleh karena itu, selama bisa mendapatkan berkas dalam format XML dan JSON, tinggal diutak-atik sedikit saja.

Yang ingin saya bagikan di sini adalah apa yang harus dilakukan untuk mengubahsuaikan Carrot2 Web Apps agar bisa menggunakan sumber dari berkas XML. Untuk itu, ada dua berkas yang perlu diubah: suite-webapp.xml dan source-xml-attributes.xml. Dengan asumsi bahwa berkas XML yang akan digunakan sudah sesuai dengan format yang dapat dibaca Carrot2 seperti contoh di sini, hal pertama yang perlu dilakukan hanyalah menambahkan kode

<include suite="source-xml.xml"/>

di dalam suite-webapp.xml. Ah iya, kedua berkas tersebut dapat ditemukan dalam folder WEB-INF di bawah folder webapps setelah deployment.

Lalu, setelah perubahan tersebut, tinggal tambahkan ganti isi source-xml-attributes.xml seperti kode di bawah ini.

<attribute-sets default="xml"><attribute-set id="xml"><value-set><label>XML</label><attribute key="XmlDocumentSource.xml"><value><wrapper url="file:///path/to/file/${query}.xml"/></value></attribute><attribute key="XmlDocumentSource.readAll"><value type="java.lang.Boolean" value="true"/></attribute></value-set></attribute-set></attribute-sets>

Perhatikan bahwa ada kode ${query} di dalamnya. Nilai tersebut akan berubah sesuai dengan query yang dimasukkan di baris pencarian nantinya. Jadi, nama berkas yang akan dijadikan sumber akan disesuaikan dengan query tersebut. Jika perubahan sudah dilakukan, maka Anda hanya perlu memuat ulang aplikasi web yang sudah di-deploy tadi. Voila!

Selamat mencoba!

Catatan: Anda memerlukan berkas XSLT jika Anda menggunakan berkas XML atau JSON yang tidak sesuai dengan format masukan yang ditetapkan oleh Carrot2. Ada atribut tambahan dalam berkas source-xml-attributes.xml agar semuanya bisa berjalan dengan baik.

Iklan

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s