Pages

Friday, February 14, 2014

Pre Prosessing Data Mining

Lanjut belajar data mining lebih dalam nih. ya semoga ga bosen ya ama teknologi data mining ini. Penasaran gak? bagaimana bentuk data yang akan dianalisis menggunakan teknik data mining? Sebelum memasuki proses data mining, ada yang namanya pre prosesing. Ada beberapa teknik yang digunakan untuk pre prosesing data, seperti reduce data, data cleaning dan lain-lain. kenapa diperlukan data pre-prosesing? karena biasanya sih data yang akan dianalisis menggunakan teknik data mining memiliki karakteristik: incomplete, artinya data-data yang memiliki atribut tidak lengkap, noisy, artinya data masih mengandung error atau outlier values, kemudian ada karakteristik inconsistent, yang artinya masih terdapat perbedaan pengkodean yang tidak seragam, nilai pada tabel A tidak sama pada tabel B misalnya.



sumber gambar : http://www.c3dmw.com/IRDC3DMW/DataMining.jsp

Nah sebelum proses analisis itu diperlukan yang namanya preprosesing data. preprosesing data diperlukan karena jenis-jenis data yang akan diolah kebanyakan juga memiliki kerusakan data seperti yang disebutkan tadi,ada data yang incomplete, noisy, dan inconsistent.  Agar preprosesing data lebih sempurna, penting untuk memiliki gambaran dari keseluruhan data. Nah, ada nih teknik yang bisa digunakan, yaitu teknik desciptive data summarization. Teknik ini dapat digunakan untuk mengidentifikasi properti dari data dan noise atau outlier. Dengan teknik ini, kita bisa menentukan karakteristik data melalui 2 cara yaitu Measuring the Central Tendency dan Measuring the Dispersion of Data. Untuk measuring the central tendency dapat meliputi mean, median, mode, dan midrange. Sedangkan teknik measuring the dispersion of data meliputi quartilisasi, interquartile range dan varian.

Sesudah itu dilakukan proses data cleaning, rutinitas ini berfungsi untuk mengisi data atau nilai-nilai yang hilang, mengurangi noise ketika sedang dilakukan identifying outliers, dan mengoreksi ketidak-konsistenan data. Noisy Data adalah error acak atau error yang bervariasi pada suatu variabel. Ada beberapa cara untuk mengurangi noisy data, yaitu binning, regresi dan clustering. Metode binning digunakan untuk smoothing nilai data. Regresi artinya data dapat dismoothing oleh fitting data kepada fungsi-fungsi tertentu. Clustering artinya pembagian data kedalam grup-grup sesuai dengan nilai-nilai yang sama.

Selanjutnya dilakukan data integrasi dan transformasi. Data integrasi sendiri adalah menggabungkan data dari berbagai sumber ke dalam satu penyimpanan (data warehouse). Sedangkan data transformasi ya berarti data akan ditransformasikan atau diubah ke dalam bentuk yang dapat dihubungkan untuk penggunaan data mining. Teknik data transformasi antara lain adalah teknik smoothing, teknik ini yang tadi uda dibahas buat mengurangi noise, kemudian ada aggregasi, yaitu menggabungkan operasi-operasi tertentu yang mengaplikasikannya pada data. Generalisasi data, Normalisasi data, dan attibute construction.

Kemudian ada data reduction, karena data yang akan dianalisis menggunakan teknik data mining sangat besar dan komplek, maka diperlukan adanya data reduksi sehingga lebih fleksibel. Beberapa teknik yang bisa digunakan adalah Data cube aggregation, attribute subset selection, dimensionality reduction, numerosity reduction, discretization and concept hierarchy generation. 

Terakhir ada teknik data discretization yang bisa digunakan untuk me reduce angka dari nilai-nilai yang akan dianalisis untuk memberikan atribut selanjutnya oleh pembagian range atribut menjadi interval.
Larose (2005) membagi fungsi data mining menjadi 6, yaitu fungsi deskripsi, fungsi estimasi, fungsi prediksi, fungsi klasifikasi, fungsi pengelompokan (clustering), dan fungsi asosiasi. Sedangkan Berry & Browne (2006) mengelompokkan keenam fungsi di atas menjadi 2, yaitu: fungsi minor (fungsi tambahan) dan fungsi mayor (fungsi utama). Fungsi deskripsi, fungsi estimasi dan fungsi prediksi masuk ke fungsi minor, sedangkan fungsi klasifikasi, fungsi clustering dan fungsi asosiasi masuk ke kelompok fungsi mayor (utama).

Pengertian dari masing-masing fungsi tersebut perlu dijabarin dengan kata-kata gak ya? kayanya sedikit deskripsi aja ya. Jadi untuk fungsi deskripsi pada data mining artinya penggambaran kelompok berdasarkan atribut atau sifat, fungsi estimasi adalah memperkirakan data yang berbentuk numerik. Fungsi prediksi adalah untuk memperkirakan data yang berbentuk kategorial. Fungsi klasifikasi berupa pengelompokan yang memiliki kelas tujuan. Clustering berupa pengelompokan data berdasarkan data yang tidak memiliki kelas tujuan tertentu. Sedangkan asosiasi merupakan pencarian antar atribut.

Uda dulu ya, semoga bermanfaat.

tag: data mining, apakah itu data mining? , pengertian dan manfaat data mining, fungsi-fungsi data mining, pre prosessing data mining, langkah-langkah persiapan proses data mining, data preprocessing data mining, data pre-prosesing, preprosesing data.

Thursday, February 13, 2014

Pengertian Data Mining


Data Mining? Apa ya itu? Baru denger atau baru mau mulai belajar nih?Ataukah sudah belajar data mining tetapi masih ndak mudeng? #eh... Ayo kita belajar bareng-bareng mengenai data mining. Sebenernya saya sendiri masih memulai belajar data mining karena tuntutan keras era  teknologi saat ini. Jadi? Apa sih penyebab dibutuhkannya data mining? Begitu pentingkah bagi suatu organisasi atau perusahaan bahkan bagi personal data? Jawaban nya adalah penting bro. Tren era big data yang sudah menggeluti era teknologi saat ini sangat memerlukan adanya data mining. Begitu banyak data yang berlalu lalang pada jaringan, misalkan saja pada facebook, dalam satu menit saja ada jutaan tera byte yang ditransaksikan pengguna facebook. Mulai dari update status, upload gambar, video, message, bahkan untuk chating. Maka analis akan menjadi kesusahan dalam menganalisis data yang berjumlah sangat besar. Oleh karena itu diperlukan data mining.

Berkenalan dengan Microsoft SharePoint 2013

SharePoint apa itu? SharePoint merupakan produk dari Microsoft. Produk ini dapat ditemukan juga pada Microsoft Office. SharePoint memungkinkan penggunanya untuk berbagi ide, konten dan visi dari perusahaan. Secara skalabilitas, SharePoint ini mampu untuk mengorganisir dan mengatur semua aset informasi suatu perusahaan, selain itu juga didesain untuk mengorganisir dan menyimpan dokumen secara personal, mensinkronisasikannya kepada anggota tim, dan anggota project. SharePoint juga memberikan fitur dimana pengguna dapat mencari para ahli di bidang-bidang tertentu, berbagi pengalaman dan pengetahuan dan menemukan koneksi ke berbagai informasi dan orang-orang. SharePoint dapat menghubungkan kepada developer yang membangun dan mendeploy berbagai aplikasi modern dan menghubungkan kepada desainer tampilan website. Selain itu, karena pada SharePoint 2013 telah dibangun pada system cloud, maka IT profesional dapat menghabiskan lebih banyak waktu mengelola informasi, memberikan inovasi dan mengelola waktu mereka secara efektif. Jadi pada intinya SharePoint memiliki 4 fungsi utama yaitu Organize, Discover, Build dan Manage.

Wednesday, February 12, 2014

Meta tag pada website

Lanjut share ilmu dari SEO yang baik dari post sebelumnya. META tag adalah kunci untuk mendapatkan peringkat halaman website yang baik pada mesin pencari. Meta tag ditulis di antara <HEAD> dan </HEAD> dalam dokumen html. Fungsi meta tag dalam sebuah dokumen html memberikan informasi tentang berbagai aspek dalam sebuah dokumen html memberikan informasi tentang berbagai aspek dari halaman web, baik nama penulis, bahasa yang digunakan, judul dan kata kunci dari halaman web.

Cara pasang / Membuat Meta Tag
1.    Meta Author (Penulis)
Meta author biasanya menyimpan nama penulis halaman web. Email Id penulis juga dapat dimasukkan ke dalam meta tag ini. Namun, meta tag ini tidak didukung oleh mesin pencari utama seperti Google, Yahoo atau MSN.
Syntaks:<META NAME=”nama author” CONTENT=”nama,id-email”>

Cara Membuat SEO Yang Baik

Akhir-akhir ini saya sering belajar mengenai bagaimana SEO yang optimal. Ya SEO adalah Search Engine Optimized. Penting sekali agar website atau blog kita dapat muncul pada peringkat atas pada sebuah mesin pencarian. Nah, saya nemu artikel yang bagus nih, mau saya share beberapa hal di bawah ini bisa dipertimbangkan untuk mengoptimalkan halaman web agar mudah ditemukan pada search engine:
1.     Pilihlah keyword yang tepat. Langkah ini sangat penting dalam SEO. Temukan kata kunci yang populer dan kata-kata yang berhubungan dengan inti dari isi website. Lalu cari tahu popularitas dan kompetisi dari setiap kata kunci tersebut. Kata kunci yang cukup popular dan sedikit kompetisi bisa dipilih sebagai kata kunci andalan. Ada beberapa alat SEO yang ada di Internet untuk membantu kita, seperti Wordtracker dan Yahoo.

2.     Mengoptimalkan taktor-faktor pendukung lainnya. Setelah selesai menganalisa dan memilih keyword yang paling tepat, selanjutnya mengoptimalkan faktor-faktor pendukung lain¬nya, seperti title tags, description tags, meta keyword tags, heading text, link URL, link text, image alt, comment dan halaman web text body (tidak disembunyikan dalam text HTML). Sebaiknya sesuaikan dengan aturan yang berlaku di masing-masing mesin pencari dalam menampilkan judul.

Slide Image dengan javascript dan html

haloo semua, bertemu lagi. Kali ini saya akan berbagi cara, bagaimana membuat image slide dengan javascript pada file hmtl atau website atau blog, tinggal dicustom aja sesuai kebutuhan. :)
pertama, kita ketikkan script berikut diatas tag </head>:
<script type="text/javascript">
<!-->
var image1=new Image();
var image2=new Image();
image1.src="source image1.jpg";
image2.src="source image2.png";
//-->
</script>


Tuesday, February 11, 2014

Tren Big Data

Big data? Apa itu? Kalau diartikan akan menjadi data yang berjumlah besar. Pengertian big data itu sendiri adalah kumpulan data yang sangat besar dan kompleks sehingga menjadi sulit untuk memproses data tersebut dengan menggunakan RDBMS tool atau aplikasi pengolahan data tradisional. Pemrosesan yang dimaksud disini adalah capture atau monitoring data, data warehouse, pencarian data, shared, transfer data, analisis serta visualisasi.

Pengelolaan big data yang meliputi mengumpulkan dan menganalisa data yang tersebar diberbagai platform, mulai dari data di media social sampai data di email, yang kemudian dijadikan bahan untuk melahirkan kebijakan perusahaan.


Cara install java pada linux

1.    Download java disini http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html pilih yang linux dan tar.gz ya.

2.    Extrak file download an, dapat melalui terminal ataupun melalui folder downloadnya langsung. Apabila menggunakan terminal, berikut perintahnya:

sudo tar xfz jdk-7u51-linux-x64.tar.gz //disesuaikan nama file yang didownload