Tag Archives: Statistik

Bagaimana cara mengumpulkan statistik pada Contrastive Divergence(CD)?

Oleh: Abu Ahmad (abuahmad@promotionme.com)

Sebagai awalan, kita asumsikan bahwa semua unit visible dan hidden adalah unit biner. Jenis unit lain akan kita bahas kemudian hari. Kita juga akan asumsikan bahwa tujuan dari pembelajaran adalah untuk menghasilkan sebuah model generatif yang bagus untuk sekumpulan vektor training. Ketika menggunakan Restricted Boltzmann Machine (RBM) untuk pembelajaran Deep Belief Nets (DBN) yang selanjutnya akan diperbaiki menggunakan propagasi balik, model generatif bukanlah tujuan akhir dan mungkin untuk dibiarkan dalam kondisi di bawah sesuai (underfitting) untuk menghemat waktu, namun hal tersebut akan kita abaikan di sini.

Syaraf Manusia Mengindra Gambar dan Rangsangan dari Luar

Syaraf Manusia Mengindra Gambar dan Rangsangan dari Luar

Pembaharuan status hidden

Asumsikan bahwa unit hidden adalah unit biner dan kita sedang menggunakan CD_1, unit hidden seharusnya mempunyai status biner stokastik ketika dihasilkan oleh sebuah vektor data. Probabilitas mengaktifkan sebuah unit hidden j, dihitung dengan menerapkan fungsi logistik \sigma(x)=1/(1+exp(-x)) pada total masukannya.

(1)   \begin{equation*}  p(h_j=1)=\sigma(b_j + \sum_iv_iw_{ij}) \end{equation*}

dan unit hidden menjadi aktif jika probabilitas ini lebih besar daripada angka acak yang dibangkitkan secara merata antar 0 dan 1.

Continue reading

PCA untuk pengolahan data

Akhirnya, kita masuk pada Principal Componens Analysis(PCA). Apa itu PCA? PCA adalah sebuah cara untuk mengenali pola dalam data, dan menyatakan data dalam sebuah cara untuk menyoroti kemiripan dan perbedaan data. Karena pola-pola dalam data bisa sulit untuk ditemukan dalam data dimensi tinggi, dimana kemewahan dari representasi grafis tidak tersedia, PCA adalah sebuah perangkat yang kuat untuk menganalisis data.
Keuntungan lain dari PCA adalah ketika anda telah menemukan pola ini dalam data, dan anda memampatkan data, yaitu, dengan mengurangi jumlah dimensi, tanpa kehilangan banyak informasi. Teknik ini digunakan dalam kompresi citra, seperti yang akan kita lihat.
Pada bagian ini akan membawa anda melalui langkah yang anda butuhkan untuk melakukan sebuah Principal Component Analysis pada sekumpulan data. Saya tidak akan menjelaskan secara tepat mengapa teknik tersebut bekerja, namun saya akan mencoba untuk menyediakan sebuah penjelasan tentang apa yang terjadi pada tiap langkah sehinga akan bisa membuat keputusan yang diketahui ketika anda mencoba menggunakan teknik ini sendiri.

Statistik Harapan Hidup Baterai

Harapan hidup baterai dari suatu merek tertentu dimodelkan dengan sebuah variabel acak normal dengan rata-rata η=4 tahun dan simpangan baku σ=6 bulan. Suatu mobil mempunyai baterai tersebut. Temukan prediksi interval harapan hidup baterai tersebut dengan koefisien konfiden γ=0.95.
Dalam contoh ini,
\delta=1-\gamma=0.05
u=1-\delta/2=0.975
z_{1-\delta/2}=2=-z_{\delta/2}
Hasil ini mengarah interval
\bar{x}\pm z_u \sigma=4\pm 2\times 0.5
Sehingga kita bisa mengharapkan dengan koefisien konfidensi 0.95 bahwa harapan hidup baterai kita akan berada di antara 3 dan 5 tahun.

Pengantar Ilmu Statistik

Probabilitas adalah sebuah disiplin ilmu matematika yang dikembangkan sebagai sebuah model abstrak dan konklusinya adalah deduksi yang berdasarkan atas aksioma-aksioma. Statistik menangani aplikasi dari permasalahan nyata dan konklusinya merupakan inferensi yang berdasar pada pengamatan. Statistik terdiri atas dua bagian: analisis dan desain.
Analisis, atau statistik matematis, adalah bagian dari probabilitas yang melibatkan utamanya ujicoba yang berulang dan kejadian dari probabilitas yang menndekati 0 atau 1. Hal ini mengarah pada inferensi yang bisa diterima sebagai mendekati kepastian. Desain, atau statistik terapan, menangani pengumpulan data dan konstruksi eksperimen yang secara cukup dijelaskan dengan model probabilistik.

(papoulis, 2002)