Slide Praseminar - Wahyu Dwi Suryanto blog

Report
Data Tracer Study
Alumni IPB
Pengembangan Data Warehouse
dan Aplikasi OLAP
Pada Data Tracer Study Alumni IPB
Menggunakan
Microsoft Business Intelligence
Oleh:
Wahyu Dwi Suryanto
NRP: G64096065
Misrosoft Bussines
Intelligance
Pembimbing:
Firman Ardiansyah, S.Kom, M.Si
?
Latar
Belakang
Wisudawan sebagai salah satu tolak ukur
Rich of data but poor of information
Perkembangan Teknologi
Microsoft Business Data Intelligance
Tujuan
Penelitian
Ruang
Lingkup
Membangun data warehouse dan pembuatan
aplikasi OLAP
Microsoft Business Intelligence
Data Tracer Study Alumni IPB yang Bekerja
2005-2010
Tinjauan
Pustaka
Praproses Data
• Proses yang harus dilakukan sebelum memasuki tahap pembuatan data
warehouse. Data yang digunakan seringkali bersifat noisy, inclomplete (data
kekurangan nilai atributnya atau hanya berisi data agregasi), dan inconsistent
(Han dan Kamber 2006)
Data warehouse
• Sekumpulan data dari berbagai macam sumber yang terintegrasi menjadi satu
(Han dan Kamber 2006)
On-line Analitical Processing (OLAP)
• Seperangkat aplikasi untuk membantu proses analisis dan perbandingan data
dalam database (Han dan Kamber 2006)
Business Intelligence
• Serangkaian kegiatan untuk mengumpulkan dan menganalisis data sehingga
dapat digunakan untuk proses pengambilan keputusan (Noviandi 2006)
Tinjauan
Pustaka
Model Data Multidimensi
• Pembuatan data warehouse didasarkan pada model data multidimensi. Model ini
menampilkan data dalam bentuk kubus. Model data multidimensi terdiri dari dimensi
dan fakta (Han dan Kamber 2006)
Skema Bintang (Star)
• Skema data warehouse yang paling sederhana. Skema ini disebut skema bintang
karena hubungan antar tabel dimensi dan tabel fakta menyerupai bintang, di mana
satu tabel fakta dihubungkan dengan beberapa tabel dimensi (Han dan Kamber
2006)
Skema Snowflake
• Variasi dari skema bintang di mana beberapa tabel dimensi dinormalisasi.
Keuntunganny adalah menghemat memori dan kerugiannya adalah membutuhkan
banyak waktu untuk memproses query (Han dan Kamber 2006)
Skema Galaksi (Fact Constellation)
• Serangkaian kegiatan untuk mengumpulkan dan menganalisis data sehingga dapat
digunakan untuk proses pengambilan keputusan (Han dan Kamber 2006)
Metode
Penelitian
Start
1. Analisis
2. Spesifikasi
Kebutuhan
3. Desain
Konseptual
4. Desain
Logikal
5. Desain Fisik
6.
Preprosesing
7. Data
Werehouse
1. Spesifikasi kebutuhan data warehouse yang akan
dibangun
2. Melakukan spesifikasi kebutuhan pengguna
3. Melakukan Desain Skema
4. Menentukan relasi data
5. Menjelaskan kubus data yang udah siap siap
digunakan.
6. Integrasi, Reduksi, Pembersihan dan Transformasi
7. Pembuatan data werehouse pada data tracer study
alumni IPB tahun 2005-2010
8. Pengujian dilakukan dengan mengevaluasi kubus
data dengan grafik
9. Pembangunan OLAP menggunakan Microsoft
Business Intelligence
Tidak Sesuai
8.
Query?
Sesuai
9. Data
werehouse
final
Selesai
Software
Server
Sistem Operasi
Browser
Webserver
Tools
Developer
Sistem operasi
Browser
Webserver
Tools
: Windows Server 2008 R2
: Internet Explorer 8
: Internet Information Services 7
: Microsoft SQL Server 2008, Microsoft
Sharepoint 2010, dan Microsoft .Net
Framework 4.0
: Windows 7 ultimate
: Internet Explorer 9
: Internet Information Services 7
: Microsoft SQL Server 2008, Microsoft
Sharepoint 2010, dan Microsoft .Net
Framework 4.0
Hardware
Server
Processor : intel core i5 650
Memory : 10 GB DDR III
Hardisk : 500 GB
Vram : Ati Radeon 5450
Developer
Prosesor Intel Core i3 2.27GHz
Memory 3GB DDR III
Harddisk 320GB
Monitor 14” (1366 x 768 pixel)
Keyboard
Mouse
Hasil dan
Pembahasan
Analisis
• Data tracer study 2005 – 2010  Ms. Word (docx), Ms.
Excel (.xslx)
• Jumlah record sebanyak 2686 record
• Data alumni bekerja
• Atribut yang diprioritaskan:
• atribut yang menarik untuk di analisis;
• nilai null < 10%;
• Tabel yang dapat direlasikan dengan tabel lainnya.
• 1 tabel fakta dan 10 tabel dimensi
• Skema Snowflake
Hasil dan
Pembahasan
Hasil dan
Pembahasan
Praprosessing Data
• Integrasi dan Reduksi
• doc, xls, xlsx  excel (xlsx)
• Penggabungan atribut-atribut  tabel besar
• Membuang atribut-atribut yang tidak terpilih
berdasarkan hasil analisis
• Atribut terpilih: 11 atribut: id_tahun,
id_departemen, id_tempat_kerja, id_bidang_usaha,
id_lama_tunggu, id_hambatan, id_bidang_kerja,
id_jabatan, id_kesesuaian, id_gaji, jumlah_alumni
• Excel (.xlsx)  Ms. SQLServer 2008 (.mdf )
Hasil dan
Pembahasan
Praprosessing Data
• Pembersihan
• Identifikasi data null, noise, tidak konsisten
• Atribut gaji diisi dengan nilai yang diperoleh dari hasil
clustering dengan mempertimbangkan atribut jabatan,
tempat kerja, bidang kerja, atau bidang usaha
• Atribut lama tunggu diisi dengan nilai kemunculan maksimal
• Menghapus nilai record bernilai null pada atribut:
id_bidang_kerja, id_hambatan, id_jabatan, id_tempat_kerja,
id_kesesuaian, id_departemen, id_bidang_usaha, dan
id_tahun.
• Penyeragaman record yang tidak konsisten seperti
• Statistik  statistika, ilkom  ilmu komputer
Daftar Pustaka
Penelitian Lanjutan dan
Kendala
Penelitian Lanjutan
1. Transformasi Data
2. Pembuatan Kubus Data
3. Pembuatan Interface Aplikasi
4. Pembuatan Aplikasi OLAP
Kendala
1. Birokrasi IPB
2. Keterbatasan Jumlah Data
3. Data yang tidak konsisten
Waktu
Penelitian
Kegiatan
Analisis Data
Integrasi dan reduksi data
Pembersihan data
Transformasi data
Desain aplikasi OLAP
Implementasi aplikasi OLAP
Pengujian aplikasi OLAP
Seminar
Sidang
1
2
3
4
Data Tracer Study
Alumni IPB
Minggu ke
5 6 7
8
9
10 11
Misrosoft Bussines
Intelligance
Data Tracer Study
Alumni IPB
Misrosoft Bussines
Intelligance
Data Warehouse &
OLAP
Kritik dan saran?
Silahkan….
Terima Kasih…
Data Tracer Study
Alumni IPB
Misrosoft Bussines
Intelligance
Data Warehouse &
OLAP

similar documents