Welcome to My Blog: January 2017

PENGANTAR TEKNOLOGI SISTEM CERDAS

ARTIFICIAL INTELLIGENCE

DAN

NATURAL LANGUAGE PROCESSING

Oleh :

ILHAM FAIZI (15114174)

Kelas :

3KA26

FAKULTAS ILMU KOMPUTER & TEKNOLOGI INFORMASI

UNIVERSITAS GUNADARMA

2016

A. Artificial Intelligence

Intelligence atau Intelegensia dapat diartikan sebagai kemampuan manusia untuk memperoleh pengetahuan serta kemampuan manusia untuk mempraktekkannya. Artificial Intelligence atau AI merupakan cabang ilmu komputer yang bertujuan untuk membuat sebuah aplikasi yang mampu menirukan cara kerja otak manusia, dengan menerima input pengetahuan dari pakar dalam bentuk fakta – fakta, teori, prosedur dan aturan, untuk kemudian diterapkan dalam proses pemecahan masalah di berbagai bidang.

Referensi :

Suparman, 1991. Mengenal Artificial Intelligence. Yogyakarta: Penerbit Andi Offset.

B. Kecerdasan Buatan vs Kecerdasan Alami

Kelebihan kecerdasan buatan :

1. Lebih permanen.

2. Memberikan kemudahan dalam duplikasi dan penyebaran.

3. Relatif lebih murah dari kecerdasan alamiah.

4. Konsisten dan teliti.

5. Dapat didokumentasi.

6. Dapat mengerjakan beberapa task lebih cepat dan lebih baik dibanding manusia.

Kelebihan kecerdasan alami :

1. Bersifat lebih kreatif.

2. Dapat melakukan proses pembelajaran secara langsung, sementara AI harus mendapatkan masukan berupa symbol dan representasi.

3. Fokus yang luas sebagai referensi untuk pengambilan keputusan, sebaliknya AI menggunakan fokus yang sempit.

Referensi :

Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.

C. Sejarah Kecerdasan Buatan

1. Cikal Bakal Kecerdasan Buatan (1943 – 1955)

2. Lahirnya Kecerdasan Buatan (1956)

3. Awal Perkembangan Kecerdasan Buatan (1952-1969)

4. Perkembangan Kecerdasan Buatan Mulai Melambat (1966-1974)

5. Sistem Berbasis Pengetahuan (1969-1979)

6. Kecerdasan Buatan Menjadi Sebuah Industri (1980-1988)

7. Kembalinya Jaringan Syaraf Tiruan (1986 – sekarang)

Referensi :

Russell, Stuart & Norvig, Peter, 2003. Artificial Intelligence, A Modern Approach, [online], (http://xgxy.cug.edu.cn/rjgcx/lzw/AI/AIMA-Second-Edition.pdf, diakses pada 9 Oktober 2016).

D. Konsep Dasar Artificial Intelligence

1. Acting Humanly : Pendekatan Uji Turing

2. Thinking Humanly : Pendekatan Model Kognitif

3. Thinking Rationally : The Laws of Thought Approach

4. Acting Rationally : The Rational Agent Approach

Referensi :

Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.

E. Disiplin Ilmu Artificial Intelligence

· Natural Languange Processing (NLP)

Natural Languange Processing (NLP) atau Pemrosesan Bahasa Alami, merupakan salah satu cabang AI yang mempelajari pembuatan sistem untuk menerima masukan bahasa alami manusia.

· Expert System (ES)

Expert System (ES) atau Sistem Pakar, merupakan salah satu cabang AI yang mempelajari pembuatan sebuah sistem yang dapat bekerja layaknya seorang pakar.

· Pattern Recognition (PR)

Pattern Recognition (PR) atau Pengenalan Pola, merupakan salah satu cabang AI yang mempelajari pembuatan sebuah sistem untuk dapat mengenali suatu pola tertentu.

· Robotic

Robotic atau Robotika, merupakan salah satu cabang AI yang menggabungkan cabang-cabang AI yang lain termasuk ketiga cabang di atas untuk membentuk sebuah sistem robotik.

Referensi :

Abraham, David., Permana, Indra W., Nugraha, Rangga A., Alvian, Moch. & Hanif, 2015. Penyelesaian Masalah 8-Puzzle dengan Algoritma Steepest-Ascent Hill Climbing, [online], (http://jurnal.untirta.ac.id/index.php/jis/article/download/465/354, diakses pada 27 September 2016).

22 PEMROSESAN BAHASA ALAMI

Dua alasan utama mengapa agen komputer kita ingin dapat memproses bahasa alami: untuk berkomunikasi dengan manusia dan untuk memperoleh informasi dari bahasa tertulis. Faktor umum dalam menangani tugas-tugas ini adalah penggunaan model bahasa: model yang memprediksi distribusi probabilitas dari ekspresi bahasa.

22.1 MODEL BAHASA

Bahasa formal, seperti bahasa pemrograman Java atau Python, telah tepat mendefinisikan model bahasa.

22.1.1 Model karakter N-gram

Salah satu model bahasa yang paling sederhana adalah distribusi probabilitas atas urutan karakter. Urutan simbol tertulis dari panjang n disebut n-gram. Sebuah model distribusi probabilitas dari urutan n huruf demikian disebut model n-gram. Salah satu tugas model karakter n-gram adalah identifikasi bahasa.

22.1.2 Merapikan Model n-gram

Komplikasi utama dari model n-gram yaitu corpus. Proses menyesuaikan kemungkinan jumlah frekuenasi rendah disebut smoothing. Pendekatan yang baik adalah model backoff, Interpolasi linear smoothing adalah model backoff yang menggabungkan trigram, bigram, dan model unigram dengan interpolasi linear.

22.1.3 Evaluasi Model

Dengan begitu banyak kemungkinan n-gram model—unigram, bigram, trigram, interpolasi smoothing dengan nilai yang berbeda dari l, Membagi korpus menjadi korpus pelatihan dan korpus validasi.

22.1.4 Model kata N-gram

Model kata n-gram perlu berurusan dengan kosa kata. Dengan modkarakter KOSAKATA Els, kita tidak perlu khawatir tantang seseorang menciptakan huruf alphabet baru.

22.2 KLASIFIKASI TEKS

Klasifikasi teks juga dikenal sebagai kategorisasi. Identifikasi bahasa dan klasifikasi genre adalah contoh dari klasifikasi teks, seperti analisis sentimen dan deteksi spam.

22.2.1 Klasifikasi oleh kompresi data

Algoritma Kompresi bekerja dengan membangun kamus dari subsequences teks, dan kemudian mengacu pada entri dalam kamus. Akibatnya, algoritma kompresi menciptakan model bahasa. Algoritma LZW langsung membuat model distribusi probabilitas maksimum-entropi.

22.3 PENGAMBILAN INFORMASI

Pengambilan informasi (IR) merupakan pencarian informasi berupa dokumen-dokumen yang relevan dengan kebutuhan pengguna informasi sehingga dapat memenuhi keinginan user.

22.3.1 Fungsi Penilaian IR

Fungsi penilaian atau Scroing Function berasal dari proyek Okapi Stephen Robertson dan Karen Sparck Jones di London City College yang telah digunakan dalam mesin pencarian atau search engine.

22.3.2 Sistem Evaluasi IR

Sistem evaluasi IR mengevaluasi apakah sebuah system IR bekerja dengan baik atau tidak, dengan menerjemahkan kebutuhan informasi kedalam kueri. Didalam evaluasi IR ini terdapat 3 level pengukuran, yaitu Pemrosesan, Pencarian, dan Kepuasan pemakai

22.3.3 Penyempurnaan IR

Sebagai penyempurnaan akhir, IR dapat ditingkatkan dengan mempertimbangkan metadata-data di luar teks dokumen. Contoh termasuk kata kunci yang disediakan manusia dan data publikasi. Di Web, link hypertext antara dokumen adalah sumber informasi yang penting.

22.3.4 Algoritma PageRank

PageRank adalah salah satu ide-ide asli dua yang mengatur pencarian google dari mesin telusuri Web lain ketika diperkenalkan pada tahun 1997. Page Rank untuk halaman p didefinisikan sebagai:

22.3.5 The HITS algorithm ( Algoritma HITS )

Algoritma HITS (Hyperlink-Induced Topic Search algorithm), juga dikenal sebagai “Hub dan Otoritas”, merupakan algoritma link-analisis berpengaruh lainnya.

22.3.6 Question answering

Sistem Question answering NLP ( pengolahan bahasa alami ) telah ada sejak 1960-an, namun barulah sejak 2001 sistem tersebut menggunakan pencarian informasi Web untuk meningkatkan cangkupan mereka secara radikal.

22.4 INFORMATION EXTRACTION

Information extraction adalah proses memperoleh pengetahuan dengan membaca sekilas teks dan mencari kejadian dari kelas objek dan hubungan antara objek – objek.

22.4.1 Finite-state automata untuk ekstraksi informasi

Tipe paling sederhana dari sistem ekstraksi informasi adalah sistem ekstraksi berbasis atribut yang mengasumsikan keseluruhan teks mengacu pada objek tunggal dan tugasnya adalah mengekstrak atribut-atribut objek tersebut.

22.4.2. Model Probabilistik Untuk Ekstraksi Informasi(Informasi Turunan)

               Ketika ekstraksi informasi harus berusaha dari keramain atau bervariasi masukan, Model probabilistik sederhana untuk urutan dengan keadaan tersembunyi adalah model Markov yang tersembunyi, atau HMM.

22.4.3 Bidang acak bersyarat untuk ekstraksi informasi

HMM adalah model generative, mode itu gabungan penuhprobabilitas dari pengamatan dan negara tersembunyi, dan dapat digunakan untuk menghasilkan sampel. Model HMM untuk mengurai teks, memulihkan pembicara, dan Semua yang kita butuhkan untk memahami teks.

22.4.4 Ekstraksi ontologi dari korporasi besar

Sebuah aplikasi yang berbeda dari teknologi ekstraksi adalah membangun basis pengetahuan besar atau ontologi fakta dari korpus.

22.4.5 Konstruksi template otomatis

Bahasa template ini dirancang agar dekat pemetaan untuk pencocokan sendiri, harus setuju untuk otomatis belajar, dan untuk menekankan presisi tinggi.

22.4.6 Pembacaan mesin

Sistem ini bekerja pada semua hubungan secara paralel. Mereka berperilaku kurang seperti sistem tradisional ekstraksi informasi yang ditujukan pada beberapa hubungan dan lebih seperti seorang pembaca manusia yang belajar dari teks itu sendiri.

Welcome to My Blog

Tuesday, 17 January 2017

PENGANTAR TEKNOLOGI SISTEM CERDAS ARTIFICIAL INTELLIGENCE DAN NATURAL LANGUAGE PROCESSING

Total Pageviews