tryfatur.artworks: Content Recognition

Kalo kamu tahu kuis seperti ‘Missing Lyrics’ dan ‘Happy Song’. Kuis ini memberikan tantangan pada pesertanya untuk melengkapi lirik yang hilang. Mereka yang mengoleksi banyak lagu dalam otaknya, dan memiliki kecerdasan musikal, mampu menebak judul lagu dengan tepat. Fakta di atas menunjukkan bahwa manusia memiliki kecerdasan untuk mengenali sebuah informasi yang utuh dari sebagian isinya. Tidak hanya musik, ketika membaca penggalan teks “... diselenggarakan dengan tjara seksama dan dalam tempo jang sesingkat-singkatnja,”misalnya, Kamu pasti tahu bahwa yang dimaksud naskah proklamasi kemerdekaan kita. Kemampuan mengenali sebuah informasi dari sebagian isinya, saat ini juga dimiliki oleh komputer yang dikenal dengan istilah content recognition. Dengan software ini, konten yang terdapat di website ?le dan video sharing, se perti Multiply, YouTube, dan yang sejenisnya, dapat di-scan untuk mengetahui apakah terdapat ?le - ?le yang dilindungi hak cipta.Mendesain software untuk mengenali konten sebuah ?le, menjadi tantangan tersendiri bagi para programmer. Banyaknya cara mengencode ?le audio dan video, serta varian bit rate dan noise, membuat program sulit mengenali sebuah ?le dari kode binarinya. File WAV dan MP3 misalnya, dapat memainkan musik yang sama, namun memiliki kode yang berbeda. Demikian pula halnya pada ? le video. Kalo pernah menonton ?lm dari DVD bajakan, Kamu pasti tahu beberapa ?lm direkam dengan kamera yang dibawa ke ruang pertujukan bioskop.Semua tindakan di atas membuat kode ?le-?le video tersebut memiliki kode yang berbeda. Lantas, bagaimana merancang software content recognition dapat mengenali semua varian ?le audio dan video?

Audio Content Recognition
Langkah pertama untuk mengidenti?kasi konten adalah membuat sebuah database yang berisi materi - materi musik sebagai rujukan bagi ?le yang akan di-scan. Software audio content recognition menganalisis setiap lagu, dan membuat tag-tagd igital yang mengidenti?kasi lagu tersebut. Tag ini disebut ?ngerprint atau signature. Selanjutnya, software menganalisis suara musik yang sedang dimainkan, bukan kode-kode digitalnya. Sebagian program menganalisis tempo dan irama atau hentakan sebuah lagu. Sebagian lainnya mengukur amplitudo dan frekuensi lagu. Pembuatan ?ngerprint biasanya mengambil beberapa detik sampel dari masing-masing lagu. Namun, ada pula software yang menganalisis sebuah lagu secara utuh untuk mendapatkan ? ngerprint yang lengkap. Atau paling tidak, software menganalisis bagian-bagian yang paling menonjol (landmark) dalam sebuah lagu. Program-program tersebut menggunakan algoritma untuk menganalisis suara. Sebagian besar menggunakan algoritma Fast Fourier Transform (FFT). Teknik matematis ini dapat mengambil serangkaian sinyal kompleks, dan melacak perubahan yang ada di dalamnya. Perubahan-perubahan tersebut apakah perubahan tempo, hentakan per menit, atau amplitudo dan frekuensi suara– dipetakan, dan secara matematis dikonversi ke dalam ?gerprint digital. Fingerprint biasanya disimpan dalam format numerik. Begitu database selesai, perusahaan rekaman dapat langsung menggunakannya untuk mendukung penjualan musik kepada calon pembeli, yang hanya tahu beberapa bagian dari sebuah lagu sekaligus melacak pendistribusian musiknya secara ilegal.

Video Content Recognition
Baru-baru ini, Time Warnet dan Disney bekerja sama dengan YouTube menguji software video content recognition yang dikembangkan oleh Google. Software ini serupa dengan audio content recognition yang telah lebih dulu ada, yakni menganalisis konten untuk membuat ?ngerprint. Kemudian, software membandingkannya dengan informasi yang ada dalam database untuk mencari kesamaan. Walaupun demikian, video menyisakan tantangan unik yang masih belum terpecahkan.Sebagai contoh, sebagian besar video yang ada di YouTube berdurasi 10 menit atau berukuran 100 MB. Untuk mengetahui apakah 10 menit tayangan tersebut merupakan segmen dari sebuah ?lm atau acara televisi yang dilindungi hak cipta, software harus menganalisis keseluruhan ?lm agar dapat mengenali potongan-potongan video yang lebih kecil. Selain itu, software juga harus mampu mengidenti?kasi sebuah adegan, kalo ?lm yang di-upload telah diedit terlebih dahulu.Misalnya, orang bisa mengelabui software yang mencocokkan resolusi warna dengan men-tweak saturasi warna dalam sebuah video. Memotong video atau meng-upload adegan yang diambil dari sebuah ?lm dengan kamera video, juga dapat mengelabui software. Beberapa ?lm bajakan yang merekam gambar dari dalam bioskop, dengan sudut yang agak miring. Hal ini juga dapat membuat proses identi? kasi menjadi lebih rumit.

Informasi Lebih Lanjut
• http://arstechnica.com/news.ars/post/20070314-motion-based-analysis-can-?lter-copyrighted-video-clips.htm l
• http://computer.howstuffworks.com/content-recognition.htm

tryfatur.artworks

Minggu, 21 Maret 2010

Content Recognition

0 komentar:

Posting Komentar