Pengantar Kuliah Computational Linguistic

13
Computational text Linguistics social media translation text mining information extraction essay scoring text categorization spam filtering semantic sentiment analysis dialogue syntactic word sense named entity 1 Ayu Purwarianti - NLP

description

Pengantar kuliah Computational Linguistics

Transcript of Pengantar Kuliah Computational Linguistic

Page 1: Pengantar Kuliah Computational Linguistic

1

ComputationaltextLinguistics

social media

translation

text mininginformation extractionessay scoring

text categorizationspam filtering

semanticsentiment analysis

dialogue

syntacticword sensenamed entity

Ayu Purwarianti - NLP

Page 2: Pengantar Kuliah Computational Linguistic

Apa itu Computational Linguistics

Teks Bahasa Alami

Bahasa Pemrograman

???Ok

Page 3: Pengantar Kuliah Computational Linguistic

3

Mengapa Belajar Computational Linguistics?

• Perkembangan internet dengan jutaan dokumen merupakan kesempatan bagi industri dgn spesialisasi bidang CL

• Keinginan manusia untuk menggunakan teknologi yg human-friendly termasuk dalam interaksi dengan menggunakan bahasa sehari-hari

• Perkembangan teknologi CL sangat terkait dengan bahasa dari sebuah negara/daerah tertentu kesempatan bagi industri lokal untuk bersaing dengan dunia global

Ayu Purwarianti - NLP

Page 4: Pengantar Kuliah Computational Linguistic

4

Prospek Industri CL

• Sangat tinggi, tergantung kreativitas

Ayu Purwarianti - NLP

Page 5: Pengantar Kuliah Computational Linguistic

TEXT MINING

Dokumen Teks

Pengetahuan

Page 6: Pengantar Kuliah Computational Linguistic

6

Information Extraction

Ayu Purwarianti - NLP

unstructured text

structured text

Page 7: Pengantar Kuliah Computational Linguistic

7

Text Categorization

Ayu Purwarianti - NLP

spam filteringLabel: spam vs bukan spam

Kategorisasi/klasifikasi teks/dokumen: Pemberian label atau kategori thd teks/dokumen secara otomatis

Sentiment analysisLabel: positif, negatif, netral

Document clusteringLabel: bebas tergantung kata kunci pd dok

Plagiarism detectionLabel: plagiat vs tdk plagiat

Essay scoringLabel: nilai

Page 8: Pengantar Kuliah Computational Linguistic

8

Information Retrieval

Sistem mampu memberi dokumen yang relevan terhadap user input yang berupa query atau kumpulan kata dengan bersumber dari kumpulan dokumen

Ayu Purwarianti - NLP

Kata-kata(dlm bhs sehari-hari)

Kumpulan dokumenyang relevan

Page 9: Pengantar Kuliah Computational Linguistic

9

Question Answering

Sistem mampu memberi jawaban atau potongan teks yg berisi jawaban untuk user input yang berupa pertanyaan secara otomatis dari kumpulan dokumen

Ayu Purwarianti - NLP

pertanyaan(dlm bhs sehari-hari)

jawaban

Page 10: Pengantar Kuliah Computational Linguistic

• Chat Robot• Example:

– Human: can you change how you look?ALICE: Yes the ALICE robot is fully parameterized.Human: how to parameterize it?ALICE: What is it to you. I haven't heard of to parameterize it.Human: I mean, I want to see you with other clothALICE: Oh I get it. Thanks for explaining that. Is it a movie?Human: No of course notALICE: A boot? A TV show? Then what is it?

Alice…

Text Understanding

Page 11: Pengantar Kuliah Computational Linguistic

Machine Translation

Sistem mampu mengubah teks dari suatu bahasa alami ke dalam

bahasa alami lain

Page 12: Pengantar Kuliah Computational Linguistic

12

Tools Dasar pada CL

Ayu Purwarianti - NLP

Pemrosesan Leksikal

Syntactic Analysis

Semantic Analysis

Pemrosesan Pragmatik

TokenisasiPemisahan kalimatStemmingLemmatisasiPOS Tagger

Named Entity TaggerPhrase Tagger

Parser

Word Sense DisambiguationSemantic Analysis

reference resolutionanaphora

Page 13: Pengantar Kuliah Computational Linguistic

13

Permasalahan pada Aplikasi CL (peluang riset)

• OOV (Out of vocabulary)– kata-kata baru yang tidak ada pada kamus

• Ambiguitas– Kata-kata yang memiliki lebih dari satu arti

• Utk bahasa Indonesia: low resource language sedikitnya tools dasar CL yang tersedia

• Keterkaitan antar tools dasar – rendahnya akurasi sebuah tools dasar akan

mempengaruhi tools dasar lain yg menggunakannya– Lamanya waktu eksekusi

Ayu Purwarianti - NLP