Ninja

Kamis, 22 April 2010

Teknik Sorting dan Teknik Searching AI

Teknik Sorting dan Teknik Searching

1. Sorting memiliki kepentingan tambahan bagi perancang algoritma paralel; ia sering
digunakan untuk melakukan permutasi data umum pada komputer dengan memori
terdistribusi. Operasi pemidahan data ini dpt digunakan untuk menyelesaikan masalah pada:
• teori graf
• geometri komputasional
• image processing
dalam waktu optimal atau hampir optimal.

Algoritma yang akan dipelajari berikut merupakan internal sort – yaitu, tabel yang di-sort
cukup kecil untuk masuk seluruhnya di memori primer. Semua algoritma berikut ini juga
men-sort dengan membandingkan sepasang elemen.

ENUMERATION SORT

Asumsi:
• Tabel dengan n elemen: a0, a1, …, an-1
• Untuk 2 elemen ai dan aj, salah satu kondisi ini pasti benar: ai aj.
• Tujuan sorting: menemukan permutasi (p0, p1, …, pn-1) sedemikian sehingga ap0 = ap1 = …
= apn-1.

Enumeration sort:
• menghitung posisi akhir setiap elemen pada list yang di-sort dan membandingkannya
dengan elemen lain dan menghitung jumlah elemen yang memiliki nilai lebih kecil.
• Jika j elemen memiliki nilai lebih kecil dari ai, maka pj=i; yaitu, elemen ai adalah (j + 1)
elemen pada list yang di-sort setelah ap0, …, apj-1.
• Jika diberikan n2 prosesor, model CRCW PRAM dapat menghitung setiap pasang elemen
dan menghitung posisi list setiap elemen dalam waktu konstan. Begitu mesin telah
menghitung posisi setiap elemen, diperlukan satu langkah lagi untuk memindahkan
elemen ybs ke lokasi yang telah urut.

ENUMERATION SORT (SPECIAL CRCW PRAM):

Parameter n {number of elements}
Global a[0...(n-1)] {elements to be sorted}
position[0...(n-1)] {sorted positions}
sorted[0...(n-1)] {Contains sorted elements}
begin
spawn(Pi,j, for all 0 = i, j <>

for a ll Pi,j, where 0 = i, j <>

if a[i] <>

for a ll Pi,0, where 0 = i <>

Satu set n elemen dapat di-sort dalam waktu T(log n) dengan n2 prosesor, jika dipakai model
PRAM CRCW dengan write simultan ke lokasi memori yang sama menyebabkan jumlah
nilai di-assign. Jika waktu yang diperlukan untuk spawn prosesor tidak dihitung, algoritma
berjalan dengan waktu konstan.

BATAS BAWAH UNTUK PARALLEL SORTING

Teorema 1:
Anggap ada n elemen yang akan di-sort pada array prosesor yang disusun menjadi mesh satu
dimensi. Juga asumsikan bahwa sebelum dan sesudah sort, elemen akan didistribusikan
merata, satu elemen per prosesor. Dengan demikian, batas bawah kompleksitas waktu pada
algoritma sorting yang mana pun adalah T(n).

Bukti:
Lebar biseksi dari jaringan mesh satu dimensi adalah 1. Misalkan posisi yang ter-sort dari
semua elemen yang pada awalnya ada pada satu sisi biseksi adalah pada sisi biseksi yang
lain, dan sebaliknya.
Maka seluruh n elemen harus melewati satu link untuk mencapai sisi
yang lain. Karena link hanya dapat membawa satu elemen sekali, jumlah langkah yang
diperlukan untuk menukar elemen melalui biseksi paling tidak adalah sebesar n. Dengan
demikian, batas bawah kompleksitas jaringan mesh satu dimensi dengan syarat-syarat
tersebut adalah T(n).

Teorema 2:
Anggap ada n elemen yang akan di-sort pada array prosesor yang tersusun sebagai mesh dua
dimensi.
Juga anggap bahwa sebelum dan sesudah sort, elemen-elemen tsb terdistribusi
merata, satu elemen per prosesor. Maka, batas bawah kompleksitas waktu untuk algoritma
sorting yang mana pun adalah T(vn).

Bukti:
Lebar biseksi jaringan mesh dua dimensi dengan n node adalah lebih kecil atau sama dengan
vn .
Misalkan posisi ter-sort dari semua elemen yang pada awalnya ada pada satu sisi
biseksi adalah di sisi lain biseksi tsb, dan sebaliknya. Maka seluruh n elemen harus melalui
salah satu dari tidak lebih vn link untuk mencapai sisi lainnya. Karena satu link hanya
dapat membawa satu elemen sekali, jumlah langkah yang diperlukan untuk menukar elemen
melintasi biseksi paling tidak adalah n/ vn . Dengan demikian, batas bawah kompleksitas
array prosesor bagaimanapun yang disusun sebagai mesh dua dimensi dan berjalan dengan
ketentuan yang telah diberikan di atas adalah T(n/ vn ) = T(vn)

Teorema 3:
Anggap ada n = 2k elemen yang akan di-sort pada array prosesor yang tersusun sebagai
jaringan shuffle-exchange.
Juga anggap bahwa sebelum dan sesudah sort, elemen
terdistribusi merata, satu elemen per prosesor. Batas bawah untuk algoritma sort mana pun
adalah T(log n).

Bukti:
Misalkan posisi ter-sort elemen yang pada awalnya berada pada node 0 adalah node n-1.
Pemindahan elemen tsb dari node 0 ke node n-1 menuntut paling tidak log n operasi
pertukaran dan paling tidak log n-1 operasi shuffle. Dengan alasan ini, batas bawah pada
algoritma sorting berbassis shuffle-exchange dengan batas-batas di atas adalah T(log n).

Sorting adalah proses menyusun elemen – elemen dengan tata urut tertentu dan
proses tersebut terimplementasi dalam bermacam aplikasi. Kita ambil contoh pada
aplikasi perbankan. Aplikasi tersebut mampu menampilkan daftar account yang aktif.
Hampir seluruh pengguna pada sistem akan memilih tampilan daftar berurutan
secara ascending demi kenyamanan dalam penelusuran data.
Beberapa macam algoritma sorting telah dibuat karena proses tersebut sangat
mendasar dan sering digunakan. Oleh karena itu, pemahaman atas algoritma –
algoritma yang ada sangatlah berguna.
Setelah menyelesaikan pembahasan pada bagian ini, anda diharapkan mampu :
1. Memahami dan menjelaskan algoritma dari insertion sort, selection sort,
merge sort dan quick sort.
2. Membuat implementasi pribadi menggunakan algoritma yang ada
6.2 Insertion Sort
Salah satu algoritma sorting yang paling sederhana adalah insertion sort. Ide dari
algoritma ini dapat dianalogikan seperti mengurutkan kartu. Penjelasan berikut ini
menerangkan bagaimana algoritma insertion sort bekerja dalam pengurutan kartu.
Anggaplah anda ingin mengurutkan satu set kartu dari kartu yang bernilai paling
kecil hingga yang paling besar.
Seluruh kartu diletakkan pada meja, sebutlah meja
ini sebagai meja pertama, disusun dari kiri ke kanan dan atas ke bawah. Kemudian
kita mempunyai meja yang lain, meja kedua, dimana kartu yang diurutkan akan
diletakkan. Ambil kartu pertama yang terletak pada pojok kiri atas meja pertama
dan letakkan pada meja kedua. Ambil kartu kedua dari meja pertama, bandingkan
dengan kartu yang berada pada meja kedua, kemudian letakkan pada urutan yang
sesuai setelah perbandingan. Proses tersebut akan berlangsung hingga seluruh kartu
pada meja pertama telah diletakkan berurutan pada meja kedua.
Algoritma insertion sort pada dasarnya memilah data yang akan diurutkan menjadi
dua bagian, yang belum diurutkan (meja pertama) dan yang sudah diurutkan (meja
kedua). Elemen pertama diambil dari bagian array yang belum diurutkan dan
kemudian diletakkan sesuai posisinya pada bagian lain dari array yang telah
diurutkan. Langkah ini dilakukan secara berulang hingga tidak ada lagi elemen yang
tersisa pada bagian array yang belum diurutkan.
Selection Sort
Jika anda diminta untuk membuat algoritma sorting tersendiri, anda mungkin akan
menemukan sebuah algoritma yang mirip dengan selection sort.
Layaknya insertion
sort, algoritma ini sangat rapat dan mudah untuk diimplementasikan.
Mari kita kembali menelusuri bagaimana algoritma ini berfungsi terhadap satu paket
kartu. Asumsikan bahwa kartu tersebut akan diurutkan secara ascending. Pada
awalnya, kartu tersebut akan disusun secara linier pada sebuah meja dari kiri ke
kanan, dan dari atas ke bawah. Pilih nilai kartu yang paling rendah, kemudian
tukarkan posisi kartu ini dengan kartu yang terletak pada pojok kiri atas meja. Lalu
cari kartu dengan nilai paling rendah diantara sisa kartu yang tersedia. Tukarkan
kartu yang baru saja terpilih dengan kartu pada posisi kedua. Ulangi langkah –
langkah tersebut hingga posisi kedua sebelum posisi terakhir dibandingkan dan
dapat digeser dengan kartu yang bernilai lebih rendah
Ide utama dari algoritma selection sort adalah memilih elemen dengan nilai paling
rendah dan menukar elemen yang terpilih dengan elemen ke-i.
Nilai dari i dimulai
dari 1 ke n, dimana n adalah jumlah total elemen dikurangi 1.

Algoritma

void selectionSort(Object array[], int startIdx, int endIdx) {
int min;
for (int i = startIdx; i < min =" i;" j =" i" min =" j;"> Secara garis besar, Pencarian dibedakan menjadi :

Uninformed search (blind search).

Tidak ada informasi mengenai jarak/cost dari current state ke goal state.

Informed search.

Ada informasi mengenai jarak/cost dari current state ke goal state.

TEKNIK PENCARIAN

Teknik-teknik uninformed search antara lain :

Breadth-first search (BFS).

Uniform cost search.

Depth-first search (DFS).

Depth-limited search.

Iterative deepening search (IDS).

Bidirectional search.

3. TEKNIK PENCARIAN

Untuk mengukur performansi teknik pencarian, terdapat empat kriteria yang dapat digunakan, yaitu :

Completeness: Apakah teknik tersebut menjamin penemuan solusi jika solusinya memang ada?

Time complexity : Berapa lama waktu yang diperlukan?

Space complexity : Berapa banyak ruang memori yang diperlukan?

Optimality: Apakah teknik tersebut menjamin menemukan solusi yang terbaik jika terdapat beberapa solusi yang berbeda?

Bagaimana metoda GPS menemukan Solusi ?

Teknik Pencarian dan Jenisnya

Simpul

Level/Cabang

Path

Parent

Child

Root

Leave

Jumlah Ruang Simpul

Langkah solusi (Solusi)

3A. BREATH FIRST SEARCH

Pencarian dilakukan pada semua simpul dalam setiap level secara berurutan dari kiri ke kanan. Jika pada satu level belum ditemukan solusi, maka pencarian akan dilakukan pada level berikutnya. Demikian seterusnya sampai ditemukan solusi.

Dengan cara ini, BFS menjamin ditemukannya solusi (jika solusinya memang ada) dan solusi yang ditemukannya paling baik.

Dengan kata lain, BFS adalah komplit dan optimal.

BFS harus menyimpan semua simpul yg pernah dibangkitkan agar BFS dapat melakukan penelusuran simpul-simpul sampai di level bawah.

Jika b adalah faktor percabangan (jumlah simpul anak yg dimiliki oleh suatu simpul) dan d adalah kedalaman solusi, maka jumlah simpul yg harus disimpan sebanyak O(bd).

Misalkan, b = 10 dan d = 8, maka BFS harus membangkitkan dan menyimpan sebanyak 100 + 101 + 102+ 103 +104 +105 +106 +107+108 = 111.111.111 simpul.

Dari segi kecepatan, hal ini mungkin masih bisa diterima.

Dari segi memori, ini menjadi masalah karena membutuhkan ruang memori yg sangat besar.

KEUNTUNGAN:

Tidak akan menemui jalan buntu

Jika ada satu solusi, maka breath first search akan menemukannya. Jika ada lebih satu solusi, maka solusi minimum akan ditemukan.

KELEMAHAN:

Membutuhkan memori yang cukup banyak, karena menyimpan semua node dalam satu pohon.

Membutuhkan waktu yang cukup lama, karena akan menguji n level untuk mendapatkan solusi pada level yang ke-(n-1).

BREATH FIRST SEARCH

Contoh :

Algoritma Breath First Search mengunjungi node-node pohon secara melebar, berawal dari level dengan depth 0 ke depth maximum. Hal ini dapat dinyatakan dalam suatu antrian.

Prosedur Breath First Search:

Begin

Tempatkan node awal dalam antrian

Repeat

Hapus antrian untuk mendapatkan unsur di depannya

If unsure antrian di depannya = goal/tujuan

Return sukses dan stop

Else do

Begin

Masukkan anak turunan dari unsure di depannya jika ada di bagian belakang dari antrian

End

Until antrian kosong

End

Node_List berikut ini menggambarkan algoritma BFS di atas. Algoritma akan berakhir bila tujuan telah tercapai.

Node_list BFS dengan tujuan akhirnya adalah node 8.

3B. DEPTH FIRST SEARCH

àPencarian dilakukan pada suatu simpul dalam setiap level dari yg paling kiri.

àJika pada level yg terdalam, solusi belum ditemukan maka pencarian dilanjutkan pada simpul sebelah kanan dan simpul yg kiri dapat dihapus dari memori.

àJika pada level yg paling dalam tidak ditemukan solusi, maka pencarian dilanjutkan pada level sebelumnya. Demikian seterusnya sampai ditemukan solusi.

>> Proses pencarian akan dilakukan pada semua anaknya sebelum dilakukan pencarian ke node-node yang selevel. Pencarian dimulai dari node akar ke level yang lebih tinggi.

>> DFS membangkitkan node-node dan membandingkan mereka, tujuan sepanjang depth pohon yang terbesar kemudian bergerak naik ke “parent” (induk) dari node yang dikunjungi terakhir, hanya jika tidak ada node lebih lanjut yang dapat dibangkitkan di bawa node terakhir yang dikunjungi.

>> Setelah bergerak naik ke induk, algoritma berusaha membangkitkan turunan baru dari node induk. Hal ini dilakukan secara berulang hingga mencapai tujuan akhir.

>> Salah satu cara sederhana untuk mewujudkan algoritma DFS adalah dengan menggunakan Stack.

Algoritma DFS sebagai berikut :

Begin

Push node awal pada stack, yang ditunjukkan dengan stack_top

While stack tidak kosong do

Begin

Pop stack untuk mendapatkan stack_top element

If stack_top_element = Tujuan

Return

Sukses dan stop

Else push turunan (cabang) stack_top element ke dalam stack

End while

End

Contoh :

Stack berikut ini menggambarkan algoritma DFS tersebut. Proses akan diterus-kan sampai stack dalam keadaan kosong.

à Kelebihan DFS adalah pemakaian memori yang lebih sedikit.

à DFS hanya menyimpan sekitar bd, di mana b adalah faktor percabangan dan d adalah kedalaman solusi.

à Jika b = 10 dan d = 3 maka jumlah simpul yg disimpan di memori adalah 1+10+10+10 = 31.

à Hal ini berbeda jauh dgn BFS yg harus menyimpan semua simpul yg pernah dibangkitkan. Pada kasus ini, jika gunakan BFS maka simpul yg tersimpan sebanyak 1+10+100+1000 =1111 simpul.

à Kelebihan DFS yg lain, jika solusi yg dicari berada pada level yg dalam dan paling kiri, maka DFS akan menemukannya dengan cepat.

à Kelemahan DFS adalah jika pohon yg dibangkitkan mempunyai level yg sangat dalam (tak terhingga), maka tidak ada jaminan menemukan solusi. Artinya DFS tidak complete.

à Kelemahan lainnya adalah jika terdapat lebih dari satu solusi yg sama tetapi berada pada level yg berbeda, maka DFS tidak menjamin untuk menemukan solusi yg paling baik. Artinya, DFS tidak optimal.

Perbandingan BFS dan DFS

(Sama-sama non heuristik search)

Kualitasnya dibedakan berdasarkan :

Jumlah ruang simpul

Solusi (Jumlah langkah mencapai Solusi)

3C. DEPTH LIMITED SEARCH (DLS)

à Metode ini berusaha mengatasi kelemahan DFS dengan membatasi kedalaman maksimum dari suatu jalur solusi.

à Sebelum gunakan DLS, harus tahu dulu brapa level maksimum dari suatu solusi.

à Kelmahannya : Jika batasan kedalaman terlalu kecil, DLS tidak dapat juga menemukan solusi yg ada. Artinya DLS bisa menjadi tidak complete jika batasan kedalamannya lebih kecil dibandingkan dgn level solusinya.

3D. UNIFORM COST SEARCH (UCS)

à Konsepnya hampir sama dgn BFS, bedanya adalah bahwa BFS menggunakan urutan level dari yg paling rendah sampai yg paling tinggi. Sedangkan UCS berusaha menemukan solusi dgn total biaya terendah yg dihitung berdasarkan biaya dari simpul asal menuju ke simpul tujuan.

à Biaya dari simpul asal ke suatu simpul n dilambangkan sebagai g(n).

Perhatikan contoh pencarian rute berikut ini :

àKarena mengikuti konsep BFS, maka UCS menjamin ditemukannya solusi dan solusi yg ditemukannya selalu yg terbaik. Dgn kata lain, UCS adalah complete dan optimal.

à Syarat yg harus dipenuhi oleh pohon UCS adalah g(successor(n) >= g(n) untuk setiap simpul n. Jika syarat ini tidak dipenuhi maka UCS menjadi tidak complete dan tidak optimal.

3E. ITERATIVE-DEEPENING SEARCH (IDS)

à IDS merupakan metode yg menggabungkan kelebihan BFS (complete dan optimal) dgn kelebihan DFS (Space complexity rendah atau membutuhkan sedikit memori).

à Konsekuensinya adalah time complexitynya menjadi tinggi.

à IDS melakukan pencarian secara iteratif menggunakan penelusuran DFS dimulai dari batasan level 0. Jika belum ditemukan solusi, maka dilakukan iterasi ke-2 untuk level 1. Demikian seterusnya sampai ditemukan solusi.

à Untuk mempercepat proses, bisa menggunakan teknik parallel processing (menggunakan lebih dari satu processor).

3F. Bi-DIRECTIONAL SEARCH (BDS)

à Dengan metode, pencarian dilakukan dari dua arah, yakni pencarian maju (dari start ke tujuan) dan pencarian mundur (dari tujuan ke start).

à Ketika dua arah pencarian telah membangkitkan simpul yg sama, maka solusi telah ditemukan, yaitu dgn cara menggabungkan kedua jalur yg bertemu.

à Jika pencarian maju dan mundur menggunakan BFS, maka jumlah langkah yg diperlukan adalah sebanyak O(2bd/2) = O(bd/2).

à Misalkan, untuk b = 10 dan d = 6, maka BFS akan membangkitkan : 1+10+102+103+104+105+106 = 1.111.111 simpul.

à Sebaliknya BDS, hanya membangkitkan 2 x (1+10+102+103) = 2.222 simpul.

à Hal ini juga sebanding terhadap jumlah memori yg diperlukan. Dalam hal ini BDS memerlukan memori untuk menyimpan 2.222 simpul.

à BDS punya harapan yg bagus untuk digunakan karena hemat waktu maupun memori juga dan selalu memberikan solusi yg optimal jika solusinya memang ada.

Tidak ada komentar: