Tugas kapita selekta
Data Mart
--Data mart
adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan
analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam
beberapa
implementasi
data warehouse, data mart adalah
miniature data warehouse. Data mart sering
digunakan
untuk
memberikan
informasi
kepada
segmen
fungsional
organisasi.
Data
mart kadang-kadang
dirancang
sebagai
gudang
data individu
dan
memberikan
kontribusi
pada
organisasi
secara
keseluruhan
sebagai
anggota
dari
sebuah
gudang
data terdistribusi.
Dalam
desain
yang lain, data mart menerima
data dari
sebuah
gudang
master data melalui
update berkala,
dalam
hal
ini
fungsionalitas
data mart sering
terbatas
pada
layanan
presentasi
untuk
klien.
◦Data
mart memfokuskan
hanya
pada
kebutuhan-kebutuhan
pemakai
yang terkait
dalam
sebuah
departemen
atau
fungsi
bisnis.
◦Data
mart biasanya
tidak
mengandung
data operasional
yang rinci
seperti
pada
data warehouse.
Data
mart hanya
mengandung
sedikit
informasi
dibandingkan
dengan
data warehouse.
Data mart lebih
mudah
dipahami
Data Mining
Data mining adalah teknik yang merupakan
gabungan metode-metode analisis data secara statistik dengan
algoritma-algoritma untuk memproses data berukuran besar. Data mining merupakan proses menemukan
informasi atau pola yang penting dalam basis data berukuran besar. Adalah
usaha
untuk
penggalian
data yang tidak
dapat
diperoleh
melalui
pelaporan
dan
OLAP karena
pola
dan
hubungannya
tersembunyi.
Data Ware House
warehouse adalah "Sebuah skema database relasional yang menyimpan data historis dan metadata dari sistem operasi atau sistem, sedemikian rupa untuk memudahkan pelaporan dan analisis data, dikumpulkan untuk berbagai tingkatan." Definisi ini adalah penggabungan dari berbagai definisi yang saya temui.
Ada beberapa poin penting di sini. Pertama, gudang data jarang berisi informasi yang ada tidak ada tempat lain dalam suatu organisasi. Tujuan dari data warehousing adalah untuk mengumpulkan dan membuat catatan sejarah dari informasi dari sistem lain. Ini mungkin sebuah aplikasi ERP, log dari aplikasi web, data dari sistem manufaktur atau bahkan data dari teleskop radio. Data ini diambil dari sistem sumber (s) dan kemudian dibersihkan dan dimasukkan ke dalam gudang data dengan alat ETL. Proses ini biasanya disebut "sesuai" sumber data ke dalam skema gudang. Aspek penting lain dari definisi adalah agregasi. Sebuah data warehouse biasanya digunakan untuk meringkas data yang selama bertahun-tahun, bulan, triwulan, atau atribut lain waktu dimensi. Hal ini membantu dalam mengidentifikasi tren historis dan membuat prediksi tentang tren masa depan. Data sering dikumpulkan dalam berbagai cara. Data agregat dapat disimpan dalam tabel agregat sehingga dapat diakses dengan cepat. Hal ini sangat penting karena tabel fakta mencapai ke miliaran baris dan ratusan gigabyte informasi yang dikumpulkan. Mengakses data ini di luar bentuk diringkas sering membutuhkan waktu yang sangat lama.
perbedaan data mart dan warehouse
on covering the following topics: Introduction to OLAP and business intelligence. (this post) Identifying the differences between a data warehouse, and a data mart. Introduction to MDX queries and the kind of SQL which a ROLAP… next? Next we’ll talk about the difference between data marts and data warehouses. The former are usually used for OLAP analysis, but they can be fundamentally related to a warehouse.
OLAP
OLAP atau yang disebut online analytical Processing yaitu Suatu jenis pemrosesan yang memanipulasi dan menganalisa data bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data multidimensi. Kemampuan OLAP ada beberapa yang sering diketahui yaitu:
nKonsolidasi melibatkan pengelompokan data. Sebagai contoh kantor-kantor cabang dapat dikelompokkan menurut kota atau bahkan propinsi. Transaksi penjualan dapat ditinjau menurut tahun, triwulan, bulan, dan sebagainya. Kadangkala istilah rollup digunakan untuk menyatakan konsolidasi
nDrill-down
adalah
suatu
bentuk
yang merupakan
kebalikan
dari
konsolidasi,
yang memungkinkan data yang ringkas dijabarkan menjadi data yang lebih detail
nSlicing and dicing (atau dikenal dengan istilah pivoting) menjabarkan pada kemampuan untuk melihat data dari berbagai sudut pandang
contoh software dari OLAP adalah
nExpress Server (Oracle)
nPowerPlay
(Cognos
Software)
nMetacube
(Informix/Stanford Technology Group)
nHighGate
Project (Sybase)