Sabtu, 06 April 2013

Belajar Statistika : Jenis Data



Sebelum mengenal lebih jauh tentang statistika, sebaiknya kita mengetahui dahulu jenis data statistika. Dalam ilmu statistika, jenis data dibedakan menjadi empat yaitu nominal, ordinal, interval dan rasio.

1.   Nominal
Data berjenis nominal membedakan data dalam kelompok yang bersifat kualitatif. Dalam ilmu statistika, data nominal merupakan data dengan level pengukuran yang paling rendah.
Contohnya, data jenis kelamin pada sampel penelitian Departemen Pendidikan, data siswa dikategorikan menjadi ’laki-laki’ yang diwaliki angka 1 dan ’perempuan’ yang diwakili angka 2. Konsekuensi dari data nominal adalah tidak mungkin seseorang memiliki dua kategori sekaligus dan angka yang digunakan di sini hanya sebagai kode/simbol saja sehingga tidak dapat dilakukan operasi matematika.

2.   Ordinal
Dalam ilmu statistika, data berjenis ordinal mempunyai level pengukuran yang lebih tinggi daripada data nominal dan termasuk data kualitatif. Pada data nominal semua data dianggap bersifat kualitatif dan setara, sedangkan pada data ordinal terdapat klasifikasi data berdasarkan tingkatannya.
Contohnya, mengenai tingkat pendidikan yang dikategorikan menjadi ’SD’ yang diwakili angka 1, ’SMP’ yang diwakili angka 2, ’SMA’ yang diwakili angka 3, ’Diploma’ yang diwakili angka 4, dan ’Sarjana’ yang diwakili angka 5. Sama halnya dengan data nominal, meskipun tingkatannya lebih tinggi, data ordinal tetap tidak dapat dilakukan operasi matematika. Angka yang digunakan hanya sebagai kode/simbol saja, dalam contoh tadi tingkat pendidikan tertinggi adalah ’Sarjana’ dan terendah adalah ’SD’ (Sarjana > Diploma > SMA > SMP > SD).

3.   Interval
Data berjenis interval termasuk dalam kelompok data kuantitatif. Dalam ilmu statistika, data interval mempunyai tingkat pengukuran yang lebih tinggi daripada data nominal maupun ordinal. Angka yang digunakan dalam data ini, selain menunjukkan urutan juga dapat dilakukan operasi matematika. Angka nol yang digunakan pada data interval bukan merupakan nilai nol yang nyata.
Contohnya, interval nilai pelajaran matematika siswa SMA 4 Surabaya adalah antara 0 sampai 100. Bila siswa A dan B masing-masing mempunyai nilai 45 dan 90, bukan berarti tingkat kecerdasan B dua kali A. Nilai 0 sampai 100 hanya merupakan rentang yang dibuat berdasarkan kategori pelajaran matematika dan mungkin berbeda dengan mata pelajaran lain.

4.   Rasio
Dalam ilmu statistika, data rasio merupakan tipe data dengan level pengukuran yang paling tinggi dibandingkan dengan tipe data lain. Data ini termasuk dalam kelompok data kuantitatif. Angka yang digunakan pada data ini menunjukkan angka yang sesungguhnya, bukan hanya sebagai symbol dan memiliki nilai nol yang sesungguhnya. Pada data ini, dapat dilakukan berbagai operasi matematika.
Contohnya, dalam sebuah bank, seseorang mempunyai tabungan dengan saldo 10.000.000 rupiah. Angka tersebut menunjukkan bahwa orang tersebut benar-benar mempunyai saldo sebesar 10.000.000 rupiah. Jika seseorang mempunyai saldo -1.000.000 rupiah berarti orang tersebut mempunyai hutang sebesar 1.000.000 rupiah. Sedangkan jika seseorang mempunyai saldo 0 rupiah berarti orang tersebut tidak mempunyai tabungan maupun hutang.

*Disusun dari berbagai sumber

Jumat, 05 April 2013

Sumbangan Para Ahli Statistika Dunia



    Beberapa sumbangan para ahli statistika dunia sampai saat ini antara lain :

  1. Braham Demoivre (1667-1754) mengembangkan teori galat atau kekeliruan (theory of error).
  2. Thomas Simpson (1757) menyimpulkan bahwa terdapat suatu distribusi yang berlanjut (continues distribution) dari suatu variabel dalam suatu frekuensi yang banyak.
  3. Pierre Simon de Lacplace (1749-1827) mengembangkan konsep demoire dan simpson ini lebih lanjut, serta menemukan distribusi normal.
  4. Karl Friedrich Gauss (1777-1855) kemudian mengembangkan teknik kuadrat terkecil (least square), simpangan baku, dan galat baku untuk rata-rata (standard error of mean).
  5. Francis Galton (1822-1911) dan Karl Pearson (1857-1936) menemukan distribusi lain yang tidak berupa kurva normal.
  6. Karl Pearson (1857-1936) melanjutkan konsep-kosnep Galton dan mengembangkan konsep regresi, korelasi, distribusi chi square dan analisis statistika kualitatif.
  7. Charles Spearman (1863-1945) murid dari Galton dan Leipzig mengembangkan konsep one factor model, yang selanjutnya beliau dijuluki sebagai “father of factor analysis”.
  8. Godfrey Thompson (1881-1955), Cyril Burt (1883-1971), Raymond Cattell (1905-1998), dan Karl Holzinger (1892-1954) memberi kontribusi pada perluasan konsep analisis faktor dari Spearman.
  9. Harold Hotelling (1895-1955) memperluas konsep one factor model dari Spearman menjadi multiple factor model.
  10. Ronald Alylmer Fisher (1890-1962) mengembangkan desain eksperimen, disamping analisis varian dan kovarian, distribusi z, t, uji signifikansi dan teori tentang perkiraan (theory of estimation).
  11. Louis Guttman (1916-1987) mengembangkan skala yang dikenal dengan skala Guttman dan banyak memberikan kontribusi pada analisis faktor.
  12. Rensis Likert (1932) mengembangkan skala yang kemudian dikenal dengan skala Likert.
  13. Andrey Kolmogorov (1903 – 1987) dan Smirnov (1900-1966) yang hasil karyanya sekarang dikenal dengan kolmogorov-smirnov test
  14. Jan Tinbergen (1937) memperkenalkan economy statistics.
  15. Neyman (1938) “Theory of Sampling Human Populations”.
  16.  M. H. Hansen dan W. N Hurwitz (1950) berkontribusi dengan “Theory of Sampling from Finite Populations
  17.  W. G. Cochran (1953-1963) dan Taro Yamane (1967) yang mengembangkan Sampling Techniques.
  18. Joreskog (1973), Kessling (1973), dan Wiley (1973) membentuk kesatuan model yang dikenal dengngan persamaan struktural. Joreskog sendiri memberikan kontribusi pada metode maximum likehood.
  19. Para pakar lain yang banyak berkontribusi dalam pengembangan ilmu statistik modern.

 *Disusun dari berbagai sumber

Kamis, 04 April 2013

Tokoh-Tokoh Statistika Dunia



1. GOTTFRIED ACHENWALL (1719-1772) 

Gottfried Achenwall


    Gottfried Achenwall lahir di Elbing, Provinsi Royal Prusia, Polandia pada tanggal 20 Oktober 1719. Ia kuliah di Universitas Leipzig dan mendapatkan gelar Master pada tahun 1746 pada Fakultas Filsafat Universitas Leipzig. Pada tahun yang sama, ia pergi ke Marburg untuk bekerja sebagai asisten profesor bidang sejarah dan hukum internasional. Pada tahun 1748 ia dipanggil oleh University of Göttingen untuk menjadi Profesor Luar Biasa bidang Filsafat. Ia juga dianugerahi gelar yang sama namun dalam bidang yang berbeda sebagai Profesor Luar Biasa bidang Hukum juga oleh Universitas yang sama pada tahun 1753. Pada tahun 1765, Achenwall menjadi court counsellor dari Kerajaan Inggris dan Pengadilan Pemilihan Hanover.
Ia menjadi terkenal karena menggunakan istilah “Statistik” untuk pertama kalinya pada karyanya yang berjudul Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse (Konstitusi Politik Negara dan Masyarakat Eropa Saat Ini) pada tahun 1749. Dalam karyanya ini, “Staatsverfassung der heutigen vornehmsten Europäischen Reiche und Völker im Grundrisse”, dia memberikan gambaran tentang konstitusi dari berbagai negara di Eropa dengan menggambarkan kondisi pertanian, manufaktur dan perdagangannya. Ia mendapatkan dukungan finansial dari Raja George III dalam melakukan penelitiannya.
     Dalam bukunya tersebut, ia menggunakan istilah “Statistik” yang menggandung arti suatu deskripsi komprehensif dari sosial, politik, dan ekonomi suatu negara. Jadi pada waktu itu, statistik adalah suatu kegiatan yang berhubungan dalam proses analisis data kenegaraan. Atas jasanya ini, para ekonom Jerman memberi julukan “Bapak Statistika”.


2. SIR JOHN SINCLAIR (1754-1835)  


Sir John Sinclair
     Sir John Sinclair lahir pada 10 Mei 1754 di Thurso Castle, Thurso, Caithness. Sir John merupakan anak tertua dari George Sinclair dari Ulbster, yang merupakan keluarga Earls of Caithness. Setelah menyelesaikan kuliahnya di University of Edinburgh, University of Glasgow, dan Trinity College, Oxford, dia diterima di Fakultas Advokat di Skotlandia dan dipanggil ke English bar (semacam badan pelayanan hukum). Namun ia tidak pernah bekerja dengan sungguh-sungguh.
     Pada tahun 1780 ia terpilih menjadi ke British House of Commons untuk Konstituen Caithness dan mewakili beberapa konstituen di Inggris. Karirnya dalam bidang politik terus menanjak sampai pada tahun 1811. Pada tahun tersebut ia kembali ke Edinburg untuk memperbaiki produksi wol di sana. Tidak hanya itu, ia juga berperan dalam pendirian Dewan Pertanian dan menjadi presiden yang pertama. Ia pun kemudian mendapat julukan “Agricultural Sir John”.
     Minatnya dalam bidang pertanian sangatlah besar. Karyanya yang paling fenomenal adalah Statistical Account of Scotland, yang memberikan informasi tentang pertanian dan industri terkait, catatan tentang sejarah alam, dan statistik populasi. Bukunya (yang juga dikenal dengan Old Statistical Account) tersebut terdiri dari 21 volume dan diterbitkan dalam rentang waktu 1791-1799. Dalam bukunya tersebut ia memperkenalkan istilah baru, yakni “Statistics”, yang ia dengar ketika berkunjung ke Jerman. Pada volume XX, halaman xiii, Sir John Sinclair menulis,
” Many people were at first surprised at my using the words “statistical” and “statistics”, as it was supposed that some in our own language might have expressed the same meaning. But in the course of a very extensive tour through the northern parts of Europe, which I happened to take in 1786, I found that in Germany they were engaged in a species of political enquiry to which they had given the name “statistics,” and though I apply a different meaning to that word—for by “statistical” is meant in Germany an inquiry for the purposes of ascertaining the political strength of a country or questions respecting matters of state—whereas the idea I annex to the term is an inquiry into the state of a country, for the purpose of ascertaining the quantum of happiness enjoyed by its inhabitants, and the means of its future improvement; but as I thought that a new word might attract more public attention, I resolved on adopting it, and I hope it is now completely naturalised and incorporated with our language. ”
     Dari tulisannya tersebut, Sir John Sinclair mengadopsi kata “Statistics” yang dia ketahui ketika melakukan perjalanan ke Jerman. Namun terdapat perbedaan antara keduanya. Di Jerman, istilah itu merujuk kepada suatu metode yang digunakan dalam hal politik dan kenegaraan, seperti misalnya untuk mengukur kekuatan politik dan menganalisis data-data kenegaraan. Sir John Sinclair menggunakan istilah ini (statistics) sebagai suatu metode untuk mengumpulkan data atau fakta di lapangan yang bersifat numerik. Pada tahun 1834, Statistical Society of London dibentuk (sekarang Royal Statistical Society). Ketika itu, ia adalah anggota tertua, yakni berusia 80 tahun.


3. SIR FRANCIS GALTON (1822 – 1911),

Sir Francis Galton
    Sir Francis Galton adalah sepupu Sir Douglas Galton, sepupu dua kali Charles Darwin, adalah seorang polymath Victoria Inggris, antropolog, egenetika, penjelajah tropis, geografer, penemu, ahli meteorologi, ahli proto-genetika, psychometrisian, dan statistikawan. Dia diberi gelar kebangsawanan pada tahun 1909.
   Galton mempunyai produktifitas intelektual tinggi dan menghasilkan lebih dari 340 makalah dan buku sepanjang hidupnya. Ia juga menciptakan konsep statistik korelasi dan regresi. Dia adalah orang yang pertama untuk menerapkan metode statistik untuk mempelajari perbedaan manusia dalam hal warisan kecerdasan, dan memperkenalkan penggunaan kuesioner dan survei untuk mengumpulkan data tentang masyarakat, yang dibutuhkan untuk genelogikal dan biografi serta untuk studi antropometrik nya.
      Dia adalah seorang pelopor dalam eugenika, mempopulerkan istilahnya sendiri “Nature versus Nurture” (alam vs pemeliharaan). Bukunya, Genius herediter (1869), adalah upaya jenius ilmiah pertama tentang sains sosial yg mempelajar kejeniusan dan kemegahan. Sebagai penyidik dari pikiran manusia, ia mendirikan psikometri (ilmu tentang mengukur kemampuan mental). dan psikologi diferensial. Dia menemukan metode untuk mengklasifikasikan sidik jari yang terbukti berguna dalam ilmu forensik.


4. KARL PEARSON (1857 – 1936)
 
Karl Pearson
   Karl Pearson adalah kontributor utama perkembangan awal statistika  hingga sebagai disiplin ilmu tersendiri. Ia mendirikan Departemen Statistika Terapan di University College London pada tahun 1911; yang mana merupakan jurusan statistika pertama kali untuk tingkat universitas di dunia.Pearson menikah dengan Maria Sharpe pada tahun 1890, dan membuahkan 3 anak. Puteranya Egon Sharpe Pearson, menjadi penggantinya sebagai Ketua Departemen Statistika Terapan di University College.
     Hasil karya Pearson adalah semua mencakup dalam hal aplikasi yang luas dalam pengembangan statistik matematis, yang mencakup bidang biologi, epidemiologi, antropometri, obat-obatan dan sejarah sosial. Pada tahun 1901, dengan Weldon dan Galton, ia mendirikan jurnal Biometrika dimana objeknya adalah mengembangan teori statistik. Dia menjadi editor jurnal ini sampai kematiannya. Dia juga mendirikan jurnal Annals of Eugenics (sekarang Annals of Human Genetics) pada tahun 1925. Dia menerbitkan Drapers Company Research Memoirs sebagian besar untuk memberikan catatan output dari Departemen Statistik terapan dan tidak dipublikasikan di tempat lain. Buah pikiran Pearson banyak menopang metode statistik klasik yang umum digunakan sekarang ini. Contoh kontribusinya adalah:
  1.  Koefisien korelasi
  2. Metode momen
  3. Sistem pearson pada kurva kontinu
  4. Chi-distance
  5. P-value
  6. Teori tes hipotesis dan teori statistik keputusan
  7. Pearson chi-square test
  8. Principal componen analysis


5. WILLIAM SEALY GOSSET (1876 – 1937)
 
William Sealy Gosset
     William Sealy Gosset dikenal sebagai seorang ahli statistik, yang terkenal dengan nama penanya student dan untuk karyanya berupa distribusi t-Student. Lahir di Canterbury, Inggris. Dari orang pasangan Agnes Sealy Vidal dan Kolonel Frederic Gosset, Gosset belajar di Winchester College sebelum belajar kimia dan matematika di New College, Oxford. Pada saat lulus pada tahun 1899, ia bergabung dengan perusahaan pembuatan bir Dublin Arthur Guinness & Son. Disinilah ia menggunakan ilmu statistiknya di bidang pembuatan bir dan seleksi varietas di ladang gerst (semacam gandum untuk membuat bir). Gosset memperoleh ilmunya dengan belajar, trial dan error dan juga menghabiskan waktunya antara 1906-7 di laboratorium biometrik milik Karl Pearson. Gosset dan Pearson memiliki hubungan yang baik, Pearson dibantu gosset dalam hal matematika dalam penulisan papernya. Pearson dibantu dengan 1980 an paper tetapi tapi ia memiliki apresiasi yang kecil terhadap pentingnya hal itu. Papernya ini sebagian besar membahas tentang pembuat bir dengan metode sampel kecil, sementara biometrician yang biasanya memiliki ratusan pengamatan dan melihat tidak ada urgensi dalam mengembangkan metode-sampel kecil.
     Peneliti lain di Guinness sebelumnya sudah menerbitkan paper yang berisi rahasia dagang dari Guinness. Untuk mencegah pengungkapan informasi rahasia lebih lanjut, Guinness melarang karyawannya menerbitkan paper, apapun informasi yang terkandung didalamnya. Ini berarti bahwa Gosset tidak bisa menerbitkan karya-karyanya di bawah namanya sendiri. Karena itu ia menggunakan nama samaran ‘student’ untuk publikasinya untuk menghindari deteksi oleh pihak Guinness. Prestasi yang paling terkenal dari Gosset disebut sebagai distribusi t-student.


6. SIR RONALD AYLMER FISHER (1890-1962)
 
Sir Ronald Aylmer Fisher
      Sir Ronald Aylmer Fisher (17 Februari 1890 – 29 Juli 1962) adalah pakar statistika, pertanian eksperimental, dan genetika kuantitatif asal Inggris. Ronald Fisher adalah pemberi landasan bagi banyak aspek dalam statistika modern, khususnya di bidang statistika inferensi, yang mempelajari teori estimasi dan uji hipotesis. Ia juga dikenal sebagai orang yang mampu menyatukan dua kutub perdebatan di awal perkembangan genetika modern: antara kutub genetika kuantitatif dan genetika kualitatif (genetika Mendel).
  Richard Dawkins, tokoh pendukung neo-Darwinisme dan ateisme, menyebutnya sebagai “Pengganti Darwin terbesar”, dan ahli sejarah statistika Anders Hald menyebut “Fisher adalah seorang jenius yang dengan sendirian menciptakan dasar-dasar ilmu statistika modern”.
     Beberapa sumbangan Fisher pada dunia statistik adalah Prinsip Disain Eksperimen, maksimum likelihood, sufficiency, ancilarity, Diskriminator Linier Fisher, dan Fisher Information. Dalam artikelnya tahun 1924 “On a distribution yielding the error functions of several well known statistics” diperkenalkan chi-square Karl Pearson dan t-student, hasil analisisnya yang lain adalah distribusi z (yang saat ini sangat dikenal bersama Distribusi F). Kontribusi ini membuatnya menjadi tokoh utama statistika abad 20.


7. PRASANTA CHANDRA MAHALANOBIS (1893-1972)
 
Prasanta Chandra Mahalanobis
     Prasanta Chandra Mahalanobis berkontribusi dalam mengembangkan analisis peubah ganda.  Salah satu kontribusinya yang besar adalah jarak Mahalanobis (D-statistik) yang merupakan ukuran jarak untuk data dengan variabel banyak yang digunakan dalam analisis klasifikasi.  Mahalanobis juga pendiri jurnal statistik India yang sangat terkenal bernama Sankya. Pada tahun 1931 Mahalanobis mendirikan Indian Statistical Institute dengan salah satu divisinya bernama National Sample Survey (NSS) yang bertugas mengumpulkan data sosioekonomik dan demografi di seluruh India.  Divisi ini membuat Mahalanobis mempunyai peranan penting dalam perencanaan ekonomi di India dan akhirnya NSS sekarang berfungsi sebagai bagian penting dari Ministry of Planning.
    Pada tahun 1931 Hotelling memperkenalkan statistik T2 yang merupakan generalisasi dari statistik t-student untuk menguji hipotesis nilai tengah pada data peubah-ganda.  Distribusi tak nol dari T2 adalah sama dengan Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan oleh Bose dan Roy pada tahun 1938.


8. RAGNAR FRISCH (1895-1973)
 
Ragnar Frisch
      Perkembangan statistika di bidang ekonomi yang dikenal dengan istilah ekonometrika dimulai tahun 1920 dipelopori Ragnar Frisch (3 March 1895 – 31 January 1973) dan Jan Tinbergen. Ekonometrika adalah cabang dari ilmu ekonomi yang merupakan integrasi antara ekonomi, matematika dan statistika. Walaupun demikian powerful perkembangan ekonometrika kurang mendapat sambutan hangat dari ekonom-ekonom besar yang kurang “sreg” dengan pemodelan termasuk John Maynard Keynes.  Keynes memandang skeptis terhadap buku Tinbergen yang berjudul Statistical Testing for Business Cycle Theory.  Baru di akhir tahun 1940 dan awal 1950 ekonometrika mulai berkembang lagi yang dipelopori oleh Chernoff, Haavelmo, Koopmans, Rubin dan Simon yang bekerja pada Cowles Commision for Research in Economics.
      Peran statistika cukup besar dalam ekonometrika terutama dalam hal metode estimasi parameter model ekonometrika yang pada umumnya terdiri dari beberapa persamaan yang saling terkait (sistem persamaan simultan dan seemingly unrelated regression).  Untuk mengestimasi parameter sistem persamaan simultan Hendri Theil tahun 1956 menemukan suatu metode 2SLS (two stage least squares).  Kemudian pada tahun 1962 Zellner menemukan suatu metode SUR (Seemingly Unrelated Regression) untuk mengestimasi parameter model sistem persamaan regresi.  Selanjutnya Theil bersama Zellner menemukan metode 3SLS (three stage least squares) untuk mengestimasi sistem persamaan simultan yang pada prinsipnya merupakan integrasi antara metode 2SLS dengan metode SUR.
    Model ekonometrika pada umumnya dibangun berdasarkan data yang bersifat time series, sehingga memunculkan model distribusi lag maupun autoregressive yang dikembangkan oleh Nerlove pada tahun 1972.  Pada umumnya model-model tersebut terjadi pelanggaran asumsi klasik (autocorrelationheteroscedasticity), sehingga belakangan muncul suatu model yang dikenal dengan ARCH (autoregressive and conditional heteroscedasticity).


9. CALYAMPUDI RADHAKRISHNA RAO (1920-sekarang)
 
Calyampudi Radhakrishnan Rao
     Calyampudi Radhakrishnan Rao (1920-sekarang) adalah mahasiswa bimbingan dari Fisher.  Rao bekerja di museum antropologi sambil menyelesaikan Ph.D tahun 1948.  Tahun 1946 Rao mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi dengan banyak grup.  Selain itu Rao juga berkontribusi dalam mengembangkan matematika statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan Blackwell pada tahun 1947.  Salah satu buku karangan Rao yang terkenal adalah Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa.



10. GENICHI TAGUCHI (1924-2012)
 
Genichi Taguchi
     Di bidang industri peran statistika yang menonjol adalah dalam bidang pengendalian kualitas dan penerapan rancangan percobaan factorial sebagian (fractional factorial) yang berusaha meminimumkan jumlah percobaan yang relatif mahal. Hal ini dapat kita kenal seperti pada metode Taguchi yang ditemukan oleh Dr. Genichi Taguchi dari Jepang sekitar tahun 1980 yang disebut juga off line quality control.









11. BRADLEY EFRON (1970-sekarang)
 
Bradley Efron
   Pada pertengahan 1970, Bradley Efron memperkenalkan metode bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstraping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneiville pada tahun 1948.  Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach.  Pada dekade 80-an perkembangan metode non parametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi distribusi dengan kernel, dan neural network.





*Disusun dari berbagai sumber