PENGANTAR TEKNOLOGI SISTEM
CERDAS
ARTIFICIAL INTELLIGENCE
DAN
NATURAL LANGUAGE PROCESSING
Oleh :
ILHAM FAIZI (15114174)
Kelas :
3KA26
FAKULTAS ILMU KOMPUTER &
TEKNOLOGI INFORMASI
UNIVERSITAS GUNADARMA
2016
A. Artificial Intelligence
Intelligence atau
Intelegensia dapat diartikan sebagai kemampuan manusia untuk memperoleh
pengetahuan serta kemampuan manusia untuk mempraktekkannya. Artificial
Intelligence atau AI merupakan cabang ilmu komputer yang bertujuan untuk
membuat sebuah aplikasi yang mampu menirukan cara kerja otak manusia, dengan
menerima input pengetahuan dari pakar dalam bentuk fakta – fakta, teori,
prosedur dan aturan, untuk kemudian diterapkan dalam proses pemecahan masalah
di berbagai bidang.
Referensi :
Suparman, 1991. Mengenal
Artificial Intelligence. Yogyakarta: Penerbit Andi Offset.
B. Kecerdasan Buatan vs Kecerdasan Alami
Kelebihan kecerdasan buatan :
1.
Lebih permanen.
2.
Memberikan
kemudahan dalam duplikasi dan penyebaran.
3.
Relatif lebih
murah dari kecerdasan alamiah.
4.
Konsisten dan
teliti.
5. Dapat
didokumentasi.
6.
Dapat
mengerjakan beberapa task lebih cepat dan lebih baik dibanding manusia.
Kelebihan kecerdasan alami :
1. Bersifat
lebih kreatif.
2.
Dapat melakukan proses
pembelajaran secara langsung, sementara AI harus mendapatkan masukan berupa
symbol dan representasi.
3.
Fokus yang luas
sebagai referensi untuk pengambilan keputusan, sebaliknya AI menggunakan fokus
yang sempit.
Referensi
:
Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta :
Penerbit Andi Offset.
C. Sejarah Kecerdasan Buatan
1.
Cikal Bakal
Kecerdasan Buatan (1943 – 1955)
2.
Lahirnya
Kecerdasan Buatan (1956)
3.
Awal
Perkembangan Kecerdasan Buatan (1952-1969)
4.
Perkembangan
Kecerdasan Buatan Mulai Melambat (1966-1974)
5.
Sistem Berbasis
Pengetahuan (1969-1979)
6.
Kecerdasan
Buatan Menjadi Sebuah Industri (1980-1988)
7.
Kembalinya
Jaringan Syaraf Tiruan (1986 – sekarang)
Referensi :
Russell, Stuart & Norvig, Peter, 2003. Artificial Intelligence, A Modern Approach,
[online], (http://xgxy.cug.edu.cn/rjgcx/lzw/AI/AIMA-Second-Edition.pdf, diakses pada 9 Oktober 2016).
D. Konsep Dasar Artificial Intelligence
1. Acting
Humanly : Pendekatan Uji Turing
2. Thinking
Humanly : Pendekatan Model Kognitif
3. Thinking
Rationally : The Laws of Thought Approach
4. Acting
Rationally : The Rational Agent Approach
Referensi
:
Desiani, Anita & Arhami, Muhammad, 2006. Konsep Kecerdasan Buatan. Yogyakarta :
Penerbit Andi Offset.
E. Disiplin Ilmu Artificial Intelligence
·
Natural
Languange Processing (NLP)
Natural
Languange Processing (NLP) atau Pemrosesan Bahasa Alami, merupakan salah satu
cabang AI yang mempelajari pembuatan sistem untuk menerima masukan bahasa alami
manusia.
·
Expert
System (ES)
Expert
System (ES) atau Sistem Pakar, merupakan salah satu cabang AI yang mempelajari
pembuatan sebuah sistem yang dapat bekerja layaknya seorang pakar.
·
Pattern
Recognition (PR)
Pattern
Recognition (PR) atau Pengenalan Pola, merupakan salah satu cabang AI yang
mempelajari pembuatan sebuah sistem untuk dapat mengenali suatu pola tertentu.
·
Robotic
Robotic
atau Robotika, merupakan salah satu cabang AI yang menggabungkan cabang-cabang
AI yang lain termasuk ketiga cabang di atas untuk membentuk sebuah sistem
robotik.
Referensi :
Abraham, David., Permana, Indra W., Nugraha, Rangga
A., Alvian, Moch. & Hanif, 2015. Penyelesaian
Masalah 8-Puzzle dengan Algoritma Steepest-Ascent Hill Climbing, [online], (http://jurnal.untirta.ac.id/index.php/jis/article/download/465/354, diakses pada 27 September 2016).
22 PEMROSESAN BAHASA ALAMI
Dua alasan utama
mengapa agen komputer kita ingin dapat memproses bahasa alami: untuk
berkomunikasi dengan manusia dan untuk memperoleh informasi dari bahasa
tertulis. Faktor umum dalam menangani tugas-tugas ini adalah penggunaan model bahasa: model yang memprediksi
distribusi probabilitas dari ekspresi bahasa.
22.1
MODEL BAHASA
Bahasa formal, seperti bahasa pemrograman Java atau
Python, telah tepat mendefinisikan model bahasa.
22.1.1
Model karakter N-gram
Salah satu model bahasa yang paling sederhana adalah
distribusi probabilitas atas urutan karakter. Urutan simbol tertulis dari
panjang n disebut n-gram. Sebuah model distribusi probabilitas dari urutan n
huruf demikian disebut model n-gram. Salah satu tugas model karakter
n-gram adalah identifikasi bahasa.
22.1.2
Merapikan Model n-gram
Komplikasi utama dari model n-gram yaitu corpus.
Proses menyesuaikan kemungkinan jumlah frekuenasi rendah disebut smoothing. Pendekatan yang baik adalah model backoff, Interpolasi linear smoothing adalah model backoff yang
menggabungkan trigram, bigram, dan model unigram dengan interpolasi linear.
22.1.3
Evaluasi Model
Dengan begitu banyak kemungkinan
n-gram model—unigram, bigram, trigram, interpolasi smoothing dengan nilai yang
berbeda dari l,
Membagi korpus menjadi korpus pelatihan dan korpus validasi.
22.1.4 Model kata N-gram
Model kata n-gram perlu berurusan dengan
kosa kata. Dengan modkarakter KOSAKATA Els, kita tidak perlu khawatir tantang
seseorang menciptakan huruf alphabet baru.
22.2 KLASIFIKASI TEKS
Klasifikasi teks juga dikenal
sebagai kategorisasi. Identifikasi bahasa dan klasifikasi genre adalah contoh
dari klasifikasi teks, seperti analisis sentimen dan deteksi spam.
22.2.1 Klasifikasi oleh
kompresi data
Algoritma Kompresi bekerja dengan
membangun kamus dari subsequences teks, dan kemudian mengacu pada entri dalam
kamus. Akibatnya, algoritma kompresi menciptakan model bahasa. Algoritma LZW
langsung membuat model distribusi probabilitas maksimum-entropi.
22.3 PENGAMBILAN INFORMASI
Pengambilan
informasi (IR) merupakan pencarian informasi
berupa dokumen-dokumen
yang relevan dengan kebutuhan pengguna informasi sehingga dapat memenuhi
keinginan user.
22.3.1 Fungsi Penilaian IR
Fungsi
penilaian atau Scroing Function berasal dari proyek Okapi Stephen Robertson dan
Karen Sparck Jones di London City College yang telah digunakan dalam mesin
pencarian atau search engine.
22.3.2 Sistem Evaluasi IR
Sistem
evaluasi IR mengevaluasi apakah sebuah system IR bekerja dengan baik atau
tidak, dengan menerjemahkan kebutuhan informasi kedalam kueri. Didalam evaluasi
IR ini terdapat 3 level pengukuran, yaitu Pemrosesan, Pencarian, dan Kepuasan
pemakai
22.3.3
Penyempurnaan IR
Sebagai
penyempurnaan akhir, IR dapat ditingkatkan
dengan mempertimbangkan
metadata-data di luar
teks dokumen. Contoh
termasuk kata kunci yang
disediakan manusia dan
data publikasi. Di
Web, link hypertext
antara dokumen adalah
sumber informasi yang penting.
22.3.4 Algoritma PageRank
PageRank adalah salah satu
ide-ide asli dua yang mengatur pencarian
google dari mesin telusuri
Web lain ketika diperkenalkan pada tahun 1997. Page Rank untuk halaman p didefinisikan sebagai:
22.3.5
The HITS algorithm ( Algoritma HITS )
Algoritma HITS (Hyperlink-Induced Topic Search
algorithm), juga dikenal sebagai “Hub dan Otoritas”, merupakan algoritma
link-analisis berpengaruh lainnya.
22.3.6
Question answering
Sistem Question answering NLP ( pengolahan bahasa
alami ) telah ada sejak 1960-an, namun barulah sejak 2001 sistem tersebut
menggunakan pencarian informasi Web untuk meningkatkan cangkupan mereka secara
radikal.
22.4
INFORMATION EXTRACTION
Information extraction adalah proses memperoleh
pengetahuan dengan membaca sekilas teks dan mencari kejadian dari kelas objek
dan hubungan antara objek – objek.
22.4.1
Finite-state automata untuk ekstraksi informasi
Tipe paling sederhana dari sistem ekstraksi informasi
adalah sistem ekstraksi berbasis atribut
yang mengasumsikan keseluruhan teks mengacu pada objek tunggal dan tugasnya
adalah mengekstrak atribut-atribut objek tersebut.
22.4.2. Model Probabilistik Untuk Ekstraksi Informasi(Informasi Turunan)
Ketika ekstraksi informasi harus berusaha dari keramain atau bervariasi masukan, Model probabilistik sederhana untuk urutan dengan keadaan tersembunyi adalah model Markov yang tersembunyi, atau HMM.
22.4.3
Bidang acak bersyarat untuk ekstraksi informasi
HMM adalah model generative, mode itu gabungan
penuhprobabilitas dari pengamatan dan negara tersembunyi, dan dapat digunakan
untuk menghasilkan sampel. Model HMM untuk mengurai teks, memulihkan pembicara,
dan Semua yang kita butuhkan untk memahami teks.
22.4.4
Ekstraksi ontologi dari korporasi besar
Sebuah aplikasi yang berbeda dari teknologi ekstraksi
adalah membangun basis pengetahuan besar atau ontologi fakta dari korpus.
22.4.5
Konstruksi template otomatis
Bahasa
template ini dirancang agar dekat pemetaan untuk pencocokan sendiri, harus
setuju untuk otomatis belajar, dan untuk menekankan presisi tinggi.
22.4.6 Pembacaan mesin
Sistem
ini bekerja pada semua hubungan secara paralel. Mereka berperilaku kurang
seperti sistem tradisional ekstraksi informasi yang ditujukan pada beberapa
hubungan dan lebih seperti seorang pembaca manusia yang belajar dari teks itu
sendiri.