Minggu, 27 Januari 2013



Tugas kapita selekta

Data Mart 
--Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.
Data mart kadang-kadang dirancang sebagai gudang data individu dan memberikan kontribusi pada organisasi secara keseluruhan sebagai anggota dari sebuah gudang data terdistribusi. Dalam desain yang lain, data mart menerima data dari sebuah gudang master data melalui update berkala, dalam hal ini fungsionalitas data mart sering terbatas pada layanan presentasi untuk klien
Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami

Data Mining
Data mining adalah teknik yang merupakan gabungan metode-metode analisis data secara statistik dengan algoritma-algoritma untuk memproses data berukuran besar.  Data mining merupakan proses menemukan informasi atau pola yang penting dalam basis data berukuran besar.  Adalah usaha untuk penggalian data yang tidak dapat diperoleh melalui pelaporan dan OLAP karena pola dan hubungannya tersembunyi.

Data Ware House
warehouse adalah "Sebuah skema database relasional yang menyimpan data historis dan metadata dari sistem operasi atau sistem, sedemikian rupa untuk memudahkan pelaporan dan analisis data, dikumpulkan untuk berbagai tingkatan." Definisi ini adalah penggabungan dari berbagai definisi yang saya temui.
Ada beberapa poin penting di sini. Pertama, gudang data jarang berisi informasi yang ada tidak ada tempat lain dalam suatu organisasi. Tujuan dari data warehousing adalah untuk mengumpulkan dan membuat catatan sejarah dari informasi dari sistem lain. Ini mungkin sebuah aplikasi ERP, log dari aplikasi web, data dari sistem manufaktur atau bahkan data dari teleskop radio. Data ini diambil dari sistem sumber (s) dan kemudian dibersihkan dan dimasukkan ke dalam gudang data dengan alat ETL. Proses ini biasanya disebut "sesuai" sumber data ke dalam skema gudang. Aspek penting lain dari definisi adalah agregasi. Sebuah data warehouse biasanya digunakan untuk meringkas data yang selama bertahun-tahun, bulan, triwulan, atau atribut lain waktu dimensi. Hal ini membantu dalam mengidentifikasi tren historis dan membuat prediksi tentang tren masa depan. Data sering dikumpulkan dalam berbagai cara. Data agregat dapat disimpan dalam tabel agregat sehingga dapat diakses dengan cepat. Hal ini sangat penting karena tabel fakta mencapai ke miliaran baris dan ratusan gigabyte informasi yang dikumpulkan. Mengakses data ini di luar bentuk diringkas sering membutuhkan waktu yang sangat lama.

perbedaan data mart dan warehouse
on covering the following topics: Introduction to OLAP and business intelligence. (this post) Identifying the differences between a data warehouse, and a data mart. Introduction to MDX queries and the kind of SQL which a ROLAP… next? Next we’ll talk about the difference between data marts and data warehouses. The former are usually used for OLAP analysis, but they can be fundamentally related to a warehouse.

OLAP
OLAP atau yang disebut online analytical Processing yaitu Suatu jenis pemrosesan yang memanipulasi dan menganalisa data bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data multidimensi. Kemampuan OLAP ada beberapa yang sering diketahui yaitu:
nKonsolidasi melibatkan pengelompokan data. Sebagai contoh kantor-kantor cabang dapat dikelompokkan menurut kota atau bahkan propinsi. Transaksi penjualan dapat ditinjau menurut tahun, triwulan, bulan, dan sebagainya. Kadangkala istilah rollup digunakan untuk menyatakan konsolidasi
nDrill-down adalah suatu bentuk yang merupakan kebalikan dari konsolidasi, yang memungkinkan data yang ringkas dijabarkan menjadi data yang lebih detail
nSlicing and dicing (atau dikenal dengan istilah pivoting) menjabarkan pada kemampuan untuk melihat data dari berbagai sudut pandang


contoh software dari OLAP adalah 
nExpress Server (Oracle)
nPowerPlay (Cognos Software)
nMetacube (Informix/Stanford Technology Group)
nHighGate Project (Sybase)