Tuesday 17 January 2017

PENGANTAR TEKNOLOGI SISTEM CERDAS ARTIFICIAL INTELLIGENCE DAN NATURAL LANGUAGE PROCESSING

PENGANTAR TEKNOLOGI SISTEM CERDAS
ARTIFICIAL INTELLIGENCE
DAN
NATURAL LANGUAGE PROCESSING










Oleh :
         
ILHAM FAIZI      (15114174)

Kelas :

3KA26




FAKULTAS ILMU KOMPUTER & TEKNOLOGI INFORMASI
UNIVERSITAS GUNADARMA
2016


A.   Artificial Intelligence
Intelligence atau Intelegensia dapat diartikan sebagai kemampuan manusia untuk memperoleh pengetahuan serta kemampuan manusia untuk mempraktekkannya. Artificial Intelligence atau AI merupakan cabang ilmu komputer yang bertujuan untuk membuat sebuah aplikasi yang mampu menirukan cara kerja otak manusia, dengan menerima input pengetahuan dari pakar dalam bentuk fakta – fakta, teori, prosedur dan aturan, untuk kemudian diterapkan dalam proses pemecahan masalah di berbagai bidang.
Referensi :
Suparman, 1991. Mengenal Artificial Intelligence. Yogyakarta: Penerbit Andi Offset.

B.   Kecerdasan Buatan vs Kecerdasan Alami
Kelebihan kecerdasan buatan :
1.     Lebih permanen.
2.     Memberikan kemudahan dalam duplikasi dan penyebaran.
3.     Relatif lebih murah dari kecerdasan alamiah.
4.     Konsisten dan teliti.
5.       Dapat didokumentasi.
6.     Dapat mengerjakan beberapa task lebih cepat dan lebih baik dibanding manusia.
Kelebihan kecerdasan alami :
1.       Bersifat lebih kreatif.
2.     Dapat melakukan proses pembelajaran secara langsung, sementara AI harus mendapatkan masukan berupa symbol dan representasi.
3.     Fokus yang luas sebagai referensi untuk pengambilan keputusan, sebaliknya AI menggunakan fokus yang sempit.
Referensi :
Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.

C.   Sejarah Kecerdasan Buatan
1.     Cikal Bakal Kecerdasan Buatan (1943 – 1955)
2.     Lahirnya Kecerdasan Buatan (1956)
3.     Awal Perkembangan Kecerdasan Buatan (1952-1969)
4.     Perkembangan Kecerdasan Buatan Mulai Melambat (1966-1974)
5.     Sistem Berbasis Pengetahuan (1969-1979)
6.     Kecerdasan Buatan Menjadi Sebuah Industri (1980-1988)
7.     Kembalinya Jaringan Syaraf Tiruan (1986 – sekarang)      
Referensi :
Russell, Stuart & Norvig, Peter, 2003. Artificial Intelligence, A Modern Approach, [online], (http://xgxy.cug.edu.cn/rjgcx/lzw/AI/AIMA-Second-Edition.pdf, diakses pada 9 Oktober 2016).

D.   Konsep Dasar Artificial Intelligence
1.       Acting Humanly : Pendekatan Uji Turing
2.       Thinking Humanly : Pendekatan Model Kognitif
3.       Thinking Rationally : The Laws of Thought Approach
4.       Acting Rationally : The Rational Agent Approach
Referensi :
Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.

E.   Disiplin Ilmu Artificial Intelligence
·        Natural Languange Processing (NLP)
Natural Languange Processing (NLP) atau Pemrosesan Bahasa Alami, merupakan salah satu cabang AI yang mempelajari pembuatan sistem untuk menerima masukan bahasa alami manusia.
·        Expert System (ES)
Expert System (ES) atau Sistem Pakar, merupakan salah satu cabang AI yang mempelajari pembuatan sebuah sistem yang dapat bekerja layaknya seorang pakar.
·        Pattern Recognition (PR)
Pattern Recognition (PR) atau Pengenalan Pola, merupakan salah satu cabang AI yang mempelajari pembuatan sebuah sistem untuk dapat mengenali suatu pola tertentu.
·        Robotic
Robotic atau Robotika, merupakan salah satu cabang AI yang menggabungkan cabang-cabang AI yang lain termasuk ketiga cabang di atas untuk membentuk sebuah sistem robotik.

Referensi :
Abraham, David., Permana, Indra W., Nugraha, Rangga A., Alvian, Moch. & Hanif, 2015. Penyelesaian Masalah 8-Puzzle dengan Algoritma Steepest-Ascent Hill Climbing, [online], (http://jurnal.untirta.ac.id/index.php/jis/article/download/465/354, diakses pada 27 September 2016).

22   PEMROSESAN BAHASA ALAMI
Dua alasan utama mengapa agen komputer kita ingin dapat memproses bahasa alami: untuk berkomunikasi dengan manusia dan untuk memperoleh informasi dari bahasa tertulis. Faktor umum dalam menangani tugas-tugas ini adalah penggunaan model bahasa: model yang memprediksi distribusi probabilitas dari ekspresi bahasa.

22.1 MODEL BAHASA
               Bahasa formal, seperti bahasa pemrograman Java atau Python, telah tepat mendefinisikan model bahasa.
22.1.1 Model karakter N-gram
               Salah satu model bahasa yang paling sederhana adalah distribusi probabilitas atas urutan karakter. Urutan simbol tertulis dari panjang n disebut n-gram. Sebuah model distribusi probabilitas dari urutan n huruf demikian disebut model n-gram. Salah satu tugas model karakter n-gram adalah identifikasi bahasa.
22.1.2 Merapikan Model n-gram
               Komplikasi utama dari model n-gram yaitu corpus. Proses menyesuaikan kemungkinan jumlah frekuenasi rendah disebut smoothing. Pendekatan yang baik adalah model backoff, Interpolasi linear smoothing adalah model backoff yang menggabungkan trigram, bigram, dan model unigram dengan interpolasi linear.
22.1.3 Evaluasi Model
               Dengan begitu banyak kemungkinan n-gram model—unigram, bigram, trigram, interpolasi smoothing dengan nilai yang berbeda dari l, Membagi korpus menjadi korpus pelatihan dan korpus validasi.
22.1.4 Model kata N-gram
      Model kata n-gram perlu berurusan dengan kosa kata. Dengan modkarakter KOSAKATA Els, kita tidak perlu khawatir tantang seseorang menciptakan huruf alphabet baru. 

22.2 KLASIFIKASI TEKS
               Klasifikasi teks juga dikenal sebagai kategorisasi. Identifikasi bahasa dan klasifikasi genre adalah contoh dari klasifikasi teks, seperti analisis sentimen  dan deteksi spam.
22.2.1 Klasifikasi oleh kompresi data
               Algoritma Kompresi bekerja dengan membangun kamus dari subsequences teks, dan kemudian mengacu pada entri dalam kamus. Akibatnya, algoritma kompresi menciptakan model bahasa. Algoritma LZW langsung membuat model distribusi probabilitas maksimum-entropi.
22.3 PENGAMBILAN INFORMASI
               Pengambilan informasi (IR) merupakan pencarian informasi berupa dokumen-dokumen yang relevan dengan kebutuhan pengguna informasi sehingga dapat memenuhi keinginan user.
22.3.1 Fungsi Penilaian IR
               Fungsi penilaian atau Scroing Function berasal dari proyek Okapi Stephen Robertson dan Karen Sparck Jones di London City College yang telah digunakan dalam mesin pencarian atau search engine.
22.3.2 Sistem Evaluasi IR
               Sistem evaluasi IR mengevaluasi apakah sebuah system IR bekerja dengan baik atau tidak, dengan menerjemahkan kebutuhan informasi kedalam kueri. Didalam evaluasi IR ini terdapat 3 level pengukuran, yaitu Pemrosesan, Pencarian, dan Kepuasan pemakai
22.3.3 Penyempurnaan IR
               Sebagai  penyempurnaan  akhir,  IR  dapat  ditingkatkan  dengan  mempertimbangkan metadata-data  di  luar  teks  dokumen.  Contoh  termasuk kata  kunci  yang  disediakan  manusia  dan  data  publikasi.  Di  Web,  link  hypertext  antara  dokumen  adalah  sumber informasi yang penting.
22.3.4 Algoritma PageRank
               PageRank adalah salah satu ide-ide asli dua yang mengatur pencarian google dari mesin telusuri Web lain ketika diperkenalkan pada tahun 1997. Page Rank untuk halaman p didefinisikan sebagai:  
22.3.5 The HITS algorithm ( Algoritma HITS )
               Algoritma HITS (Hyperlink-Induced Topic Search algorithm), juga dikenal sebagai “Hub dan Otoritas”, merupakan algoritma link-analisis berpengaruh lainnya.
22.3.6 Question answering
               Sistem Question answering NLP ( pengolahan bahasa alami ) telah ada sejak 1960-an, namun barulah sejak 2001 sistem tersebut menggunakan pencarian informasi Web untuk meningkatkan cangkupan mereka secara radikal.

22.4 INFORMATION EXTRACTION
               Information extraction adalah proses memperoleh pengetahuan dengan membaca sekilas teks dan mencari kejadian dari kelas objek dan hubungan antara objek – objek.
22.4.1 Finite-state automata untuk ekstraksi informasi
               Tipe paling sederhana dari sistem ekstraksi informasi adalah sistem ekstraksi berbasis atribut yang mengasumsikan keseluruhan teks mengacu pada objek tunggal dan tugasnya adalah mengekstrak atribut-atribut objek tersebut.
 
22.4.2. Model Probabilistik Untuk Ekstraksi Informasi(Informasi Turunan)
               Ketika ekstraksi informasi harus berusaha dari keramain atau bervariasi masukan, Model probabilistik sederhana untuk urutan dengan keadaan tersembunyi adalah model Markov yang tersembunyi, atau HMM.
22.4.3 Bidang acak bersyarat untuk ekstraksi informasi
               HMM adalah model generative, mode itu gabungan penuhprobabilitas dari pengamatan dan negara tersembunyi, dan dapat digunakan untuk menghasilkan sampel. Model HMM untuk mengurai teks, memulihkan pembicara, dan Semua yang kita butuhkan untk memahami teks.
22.4.4 Ekstraksi ontologi dari korporasi besar
               Sebuah aplikasi yang berbeda dari teknologi ekstraksi adalah membangun basis pengetahuan besar atau ontologi fakta dari korpus.
22.4.5 Konstruksi template otomatis
               Bahasa template ini dirancang agar dekat pemetaan untuk pencocokan sendiri, harus setuju untuk otomatis belajar, dan untuk menekankan presisi tinggi.
22.4.6 Pembacaan mesin
               Sistem ini bekerja pada semua hubungan secara paralel. Mereka berperilaku kurang seperti sistem tradisional ekstraksi informasi yang ditujukan pada beberapa hubungan dan lebih seperti seorang pembaca manusia yang belajar dari teks itu sendiri.