Thursday, November 11, 2010

Speech Syntesis

Speech sintesis adalah buatan ucapan manusia. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut speech synthesizer, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. A text-to-speech (TTS) sistem bahasa normal mengkonversi teks ke dalam speech; sistem lain yang memberikan representasi linguistik simbolis seperti transkripsi fonetik bicara.


Speech buatan dapat dibuat dengan potongan-potongan concatenating speech yang direkam disimpan dalam database. Sistem berbeda dalam ukuran speech yang disimpan unit; sebuah sistem yang menyimpan telepon atau diphones memberikan output terbesar jangkauan, tapi mungkin kurang jelas. Untuk keperluan khusus domain, yang menyimpan seluruh kata-kata atau kalimat memungkinkan output yang berkualitas tinggi. Atau, synthesizer dapat menggabungkan model sistem vokal dan karakteristik suara manusia lain untuk membuat yang benar-benar "sintetik" output suara.

Kualitas synthesizer speech dinilai oleh kesamaan dengan suara manusia dan kemampuannya untuk dipahami. Sebuah dimengerti text-to-speech program yang memungkinkan orang-orang dengan gangguan visual atau membaca cacat untuk mendengarkan karya-karya tulis di komputer rumah. Banyak sistem operasi komputer termasuk alat bicara sejak awal 1980-an.
Festival Speech Synthesis System
Festival adalah bahasa multi-sistem sintesis umum, awalnya dikembangkan di Centre for Speech Technology Research (CSTR) di University of Edinburgh. Kontribusi yang cukup besar juga telah disediakan oleh Carnegie Mellon University dan situs lainnya. Ini didistribusikan di bawah lisensi perangkat lunak bebas mirip dengan BSD License.
Menawarkan teks penuh untuk sistem speech dengan berbagai API, serta suatu lingkungan untuk penelitian dan pengembangan sintesis berbicara teknik. Hal ini ditulis dalam C + + dengan perintah Skema seperti juru bahasa untuk kustomisasi umum dan ekstensi. [1]
Festival ini dirancang untuk mendukung berbagai bahasa, dan datang dengan dukungan untuk Inggris (Inggris dan Amerika pengucapan), Welsh, dan Spanyol. Paket suara yang ada untuk beberapa bahasa lain, seperti Castile Spanyol, Ceko, Finlandia, Hindi, Italia, Bahasa Marathi, Rusia dan Telugu


Sumber :
http://en.wikipedia.org/wiki/Speech_synthesis
http://en.wikipedia.org/wiki/Festival_Speech_Synthesis_System
http://www.cstr.ed.ac.uk/projects/festival/

Readmore »»

Wednesday, November 10, 2010

Speech Recognition

Speech recognition (juga dikenal sebagai pengenalan suara otomatis atau komputer pengenalan suara) mengkonversi teks yang diucapkan dengan kata. Istilah "pengenalan suara" kadang-kadang digunakan untuk merujuk kepada speech recognition di mana sistem recognition dilatih untuk pembicara tertentu - seperti halnya bagi sebagian besar perangkat lunak pengenal desktop, maka ada aspek pembicara, yang mencoba untuk mengidentifikasi orang berbicara, untuk lebih mengenal apa yang dikatakan. Speech recognition adalah istilah yang luas yang berarti dapat mengenali hampir siapa pun speech - seperti sebuah pusat panggilan sistem yang dirancang untuk mengenali banyak suara. Pengenalan suara adalah sebuah sistem dilatih untuk pengguna tertentu, di mana ia mengakui ucapan mereka berdasarkan suara vokal mereka yang unik.


Aplikasi pengenalan suara termasuk panggilan suara (misalnya, "Call home"), call routing (misalnya, "Saya ingin membuat collect call"), alat rumah tangga domestik DNS dan berbicara konten berbasis pencarian audio (misalnya, menemukan podcast tempat tertentu kata yang terucap), entri data sederhana (misalnya, memasukkan nomor kartu kredit), penyusunan dokumen terstruktur (misalnya, sebuah laporan radiologi), speech-untuk-pengolahan teks (misalnya, pengolah kata atau email), dan di dalam pesawat terbang cockpits ( biasanya disebut suara langsung Input).

Sumber :
Davies , K.H., Biddulph, R. and Balashek, S. (1952) Automatic Speech Recognition of Spoken Digits, J. Acoust. Soc. Am. 24(6) pp.637 – 642
http://en.wikipedia.org/wiki/Speech_recognition

Readmore »»

Browsing Audio Data

Dalam beberapa tahun terakhir, perkembangan Internet telah didefinisikan kembali dalam berbagai bidang hiburan, khususnya, yaitu musik dan video. Hari ini, real-time Internet Real audio streaming musik dan MP3 secara teratur dinikmati oleh jutaan pendengar. Makalah ini menyajikan multimedia yang berpusat manusia audio (audio informasi) sistem pencarian melalui jaringan komputer. Karya ini juga telah diurus memainkan audio yang terus-menerus tanpa ada data yang mengganggu dengan menerapkan mekanisme streaming dan buffering.

Arsitektur sistem client-server berikut model. Database digunakan untuk menyimpan informasi metadata audio. Server audio yang bertanggung jawab untuk mengambil informasi dari database untuk memenuhi permintaan klien. Klien menyediakan antarmuka komputer manusia untuk pengguna melalui antarmuka pengguna grafis untuk browsing, mencari dan memainkan audio yang menarik melalui jaringan. Berdasarkan masukan klien permintaan pengguna ke server untuk mendapatkan informasi audio (seperti daftar film-film bahasa tertentu, daftar lagu-lagu film tertentu dan daftar lagu berdasarkan pencocokan pengguna memasukkan teks lirik). Audio pengambilan informasi dari basis data akan dilakukan oleh server berbasis teks menggunakan metode pencarian.


Sebuah jaringan metode browsing disediakan untuk browsing video / audio data yang ditembak oleh sebuah IP kamera. Sebuah komputer lokal digabungkan ke LAN (local area network) untuk mendeteksi IP kamera. Metode browsing jaringan mencakup langkah-langkah dari: mengeksekusi program aplikasi komputer lokal untuk mendapatkan kode identifikasi IP yang tersimpan dalam kamera; transmisi untuk mendaftarkan kode identifikasi ke DDNS (Dynamic Domain Name Server) oleh program aplikasi; mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi dan kopel ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditembak oleh kamera IP. Server layanan menangkap video / audio data yang ditembak oleh kamera IP melalui Internet.

Contoh Brwosing audio Data

Gambar Web 4shared

4shared merupakan sebuah web yang menyediakan penyimpanan sebuah data-data multimedia seperti musik dan video,yang nanti nya akan di browsing kembali untuk di putar di web tersebut atau dapat pula di download.

Sumber :
http://www.freshpatents.com/Network-video-audio-browsing-system-and-browsing-method-thereof-dt20090702ptan20090172088.php
http://www.computer.org/portal/web/csdl/doi/10.1109/ICFCC.2009.123

http://www.4shared.com/audio/

Readmore »»

Computer Vision

Computer Vision adalah ilmu dan teknologi pada mesin yang dapat melihat, di mana yang di lihat dalam hal ini berarti bahwa mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. Sebagai suatu disiplin ilmu, Computer Vision berkaitan dengan teori di balik sistem buatan yang dapat mengekstrak informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multi-dimensi dari scanner medis.


Sebagai disiplin teknologi, Computer vision berusaha untuk menerapkan teori dan model untuk pembangunan Computer Vision System. Contoh aplikasi dari Computer Vision mencakup sistem untuk:

* Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
* Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
* Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan).
* Modeling benda atau lingkungan (misalnya, inspeksi industri, analisis citra medis atau model topografi).
* Interaksi (misalnya, sebagai input ke perangkat untuk interaksi komputer-manusia).

Computer Vision berkaitan erat dengan kajian visi biologis. Bidang studi visi biologis dan model proses fisiologis di balik persepsi visual pada manusia dan hewan lainnya. Computer Vision, di sisi lain, mempelajari dan menggambarkan proses diimplementasikan nya pada perangkat lunak dan perangkat keras di balik pembuatan system artificial vision. pertukaran Interdisipliner antara visi biologi dan komputer telah terbukti bermanfaat bagi kedua bidang.

Computer Vision, dalam beberapa hal, merupakan kebalikan dari computer grafis. Sementara komputer grafis menghasilkan data gambar dari model 3D, sedang kan visi komputer sering menghasilkan model 3D dari data citra.

Contoh dari computer vision adalah termasuk adegan rekonstruksi, deteksi event, pelacakan video, pengenalan obyek, belajar, indexing, estimasi gerak, dan pemulihan citra.

Gambar Computer Vision based reconstruction of human movements from video

Sumber : http://en.wikipedia.org/wiki/Computer_vision

Readmore »»

Tangible User Interface

Tangible User Interface (TUI) adalah sebuah antarmuka pengguna di mana seseorang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal dari TUI adalah Graspable User Interface (GUI), yang tidak lagi digunakan.


Salah satu pionir dalam user interface yang nyata adalah Hiroshi Ishii, seorang profesor di MIT Media Laboratory yang mengepalai Tangible Media Group. visi tertentu Nya bagi Tangible UIS adalah Bits Tangible, yiatu memberikan bentuk fisik ke informasi digital, membuat bit-bit nya dapat di maniplulasi secara langsung dan terlihat jelas. Tangible bits mengejar kesamaan antara dua dunia yang sangat berbeda yaitu dari bit dan atom.

Jadi secara harfiah nya tangible user interface (TUI) adalah sebuah system digital yang membuat sebuah benda menjadi nyata,dapat di sentuh di raba dan memiliki bentuk,

Contoh dari UI Tangible adalah Mesin Penjawab Marmer oleh Durrell Uskup (1992). marmer adalah merupakan suatu pesan yang ditinggalkan di mesin penjawab. Menjatuhkan marmer ke piring pemutar,lalu memutar ulang pesan yang terkait.

Contoh lain adalah sistem Topobo. Blok di Topobo seperti blok LEGO yang bisa diambil bersama-sama, tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang dapat mendorong, menarik, dan memutar blok-blok, dan blok-blok bisa menghafal gerakan-gerakan ini dan menggulang kembali gerakan-gerakan tersebut.


Gambar Crate Tangible User Interface

Video Crate Tangible UI

Sumber :

http://en.wikipedia.org/wiki/Tangible_User_Interface

http://www.youtube.com/watch?v=jXHFqNEOQdE&feature=player_embedded


Baca secara fonetik

Readmore »»

Head Up Display System (HUD)

Head Up Display (HUD) adalah setiap tampilan transparan yang menampilkan data tanpa mengharuskan pengguna untuk melihat dari sudut pandang yang biasa mereka lihat. Asal usul nama berasal dari pilot yang dapat melihat informasi dengan melihat ke atas "up" dan melihat ke depan, bukannya miring ke bawah melihat instrumen yang lebih rendah.

Meskipun mereka pada awalnya dikembangkan untuk penerbangan militer, HUDs sekarang digunakan dalam pesawat komersial, mobil, dan aplikasi lainnya.

Sejarah Head Up Display System

HUDs pertama berasal dari pandangan teknologi senjata statis untuk pesawat tempur militer.HUDs memproyeksikan "pipper" untuk membantu meposisikan sasaran pada senjata pesawat. Seiring berkembang nya jaman HUDs yang sekrang lebih maju, dan lebih kompleks,dan lebih banyak informasi yang telah ditambahkan. HUD dapat menampilakan perhitungan jarak tembak meriam, dan dengan menambahkan informasi pada pesawat seperti menghitung kecepatan udara dan sudut serangan, sehingga sangat meningkatkan akurasi pilot di udara untuk pertempuran udara. Sebuah contoh awal dari apa yang disebut sebagai head up display adalah Sistem Proyektor dari AI udara Inggris Mrk radar VIII intersepsi dipasang ke beberapa The Haviland Mosquitoo the Fighter, di mana layar radar diproyeksikan ke kaca depan pesawat bersama dengan tampilan buatan cakrawala, memungkinkan pilot untuk melakukan interceptions tanpa menenggokan mata mereka dari kaca depan.

HUD teknologi yang berikutnya maju dalam Buccaneer, prototipe yang pertama terbang pada tanggal 30 April 1958. Desain pesawat yang di gunakan untuk melihat serangan dan akan menyediakan navigasi serta informasi senjata rilis untuk modus serangan tingkat rendah. Sementara ada persaingan sengit antara pendukung desain HUD baru dan pendukung The Old Elecktro Mechanical Gunsight, HUD digambarkan sebagai pilihan yang radikal. The Air Arm cabang dari Departemen mensponsori pengembangan Sight Strike. The Royal Aircraft Establishment (RAE) merancang peralatan nya, lalu dibangun oleh Cintel, dan sistem terintegrasi pertama kali pada tahun 1958. Bisnis pada perusahaan The Cintel HUD diambil alih oleh Elliott Flight Automation dan HUD Buccaneer diproduksi dan dikembangkan lebih lanjut terus sampai ke versi Mark III dengan total 375 sistem yang dibuat.


Penggunaan HUDs kemudian berkembang di luar pesawat militer. Pada 1970-an, HUD diperkenalkan untuk penerbangan komersial, dan pada tahun 1988, Oldsmobile Cutlass Supreme menjadi mobil produksi pertama dengan head up display.

Type-type HUD

Helmet mounted displays (HMD) secara teknis memiliki bentuk HUD, perbedaan nya adalah mereka menampilkan elemen tampilan yang bergerak sesuai dengan orientasi dari si pengguna helmet tersebut.

Banyak pesawat tempur modern (seperti F/A-18, F-22, Eurofighter) penggunaan baik HUD dan HMD secara bersamaan. F-35 Lightning II dirancang tanpa HUD, mengandalkan hanya pada HMD, sehingga pejuang militer pertama modern tidak memiliki HUD tetap.

Generasi-Generasi HUD

HUDs dibagi menjadi empat generasi mencerminkan teknologi yang digunakan untuk menghasilkan gambar.

* Generasi Pertama-Menggunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor, memiliki kelemahan dari lapisan fosfor layar merendahkan dari waktu ke waktu.


* Generasi Kedua-Menggunakan LED, yang dimodulasi oleh layar LCD untuk menampilkan gambar. Sistem ini tidak memudar atau memerlukan tegangan tinggi.


* Generasi Ketiga-Menggunakan panduan gelombang optik untuk menghasilkan gambar secara langsung pada Combiner daripada menggunakan sistem proyeksi.


* Generasi Keempat-Menggunakan laser scanning untuk menampilkan gambar dan bahkan gambar video pada media transparan yang jelas.

1). Contoh penggunaan HUD dalam automotife

Automobile

General Motors mulai menggunakan display head-up pada tahun 1988 dengan layar warna, pertama muncul pada tahun 2001 pada Corvette. Pada tahun 2003, BMW menjadi produsen Eropa pertama yang menawarkan HUDs. Menampilkan menjadi semakin tersedia dalam mobil produksi, dan biasanya menawarkan speedometer, tachometer, dan menampilkan sistem navigasi. Tampilan malam pun juga ditampilkan melalui HUD di General Motors tertentu, Honda, Toyota dan kendaraan Lexus. Manufaktur lainnya seperti Citroen, Saab, dan Nissan saat ini menawarkan beberapa bentuk sistem HUD. HUDs Sepeda Motor helm juga tersedia secara komersial.

HUD digunakan untuk mempermudah pengguna dalam menavigasikan kendaraan nya dengan baik dan agar memnimimalkan jumlah terjadinya kelakaan saat berkendaraan, seperti contoh nya apabila seorang pengendara sedang mengedarai kendaraan dengan kecepatan 100 km / jam ingin mengalih kan pandangan nya walaupun hanya 1 detik itu dapat ber akibat fatal karena dalam 1 detik itu mobil sudah melaju sejauh 27 meter.

Fakta lapangan seperti itulah yang mendasari industri otomotif terus berupaya meminimalkan resiko, dengan menciptakan sistem kontrol. Salah satunya, dengan Head-Up Display (HUD), yang memiliki prospek menjanjikan. Itu karena HUD mampu menampilkan informasi penting pada kaca depan, langsung pada area pandang pengemudi, hingga ia tak perlu lagi menunduk atau celingukan mengalihkan pandangannya dari jalan di depannya. Dengan memanfaatkan proyektor laser (laser projector), diharapkan kaca mobil depan nantinya bisa berfungsi sebagai layar monitor yang bisa menampilkan berbagai informasi berguna bagi pengendara.

Video New GM Head Up Display uses lasers to augment entire windshield

Sumber :

www.en-wikipedia.org

www.youtube.com

www.zonapencarian.blogspot.com

Readmore »»