Dear all,

I gave a short talk last Friday about strategies that universities and industries can formulate to address skill mismatch in our labor market. It was part of a broader discussion about OECD’s service trade restriction index (STRI). The results show that Indonesia is facing service trade restriction in some fields, some of it is due to the lack of skilled workers and professional in specific fields. While labor market mobility is quite limited, higher education institutions have not been up to date in providing skills demanded by the labor market.

You can find the slide of my talk via the link below. The view is of my own and does not reflect my institution’s view.

Addressing skill mismatch

Cheers,
GS

Advertisements

Salah satu konsep yang paling menantang dalam pembelajaran statisika inferensi adalah sampling distributionSampling distribution adalah distribusi dari statistik seperti rata-rata sampel. Namun demikian, peneliti biasanya hanya mendapatkan satu sampel acak dari populasi untuk setiap studi. Oleh karena itu, rata-rata sampel bisa lebih tinggi atau lebih rendah dibanding rata-rata sesungguhnya di populasi (yang tidak kita ketahui).

Simulasi di bawah ini menjelaskan konsep repeated sampling dan bagaimana nilai ekspektasi dari rata-rata sampel sama dengan rata-rata sesungguhnya di populasi. Perangkat lunak yang pengarang gunakan untuk simulasi adalah Stata.

** populasi terdiri dari 1000 individu

set obs 10000

** tetapkan seed untuk replikasi

set seed 3143

** buatlah variabel acak dari distribusi normal dengan rata-rata 4 dan deviasi standar 3

gen X = rnormal(4,3)

** cek ringkasan statistik

sum X

** pilih secara acak sampel yang terdiri dari 30 individu

** mengapa Anda memilih sampel secara acak?

gen random = runiform()

sort random

** hitung nilai rata-rata sampel 

sum X if _n <= 30

display “the sample mean is ” %9.2fc r(mean)

 ** uji apakah rata-rata sampel berbeda secara signifikan dengan

** nilai sesungguhnya di populasi, yaitu 4

** Apa kesimpulan Anda dari uji tersebut?

ttest X = 4 if _n <= 30

Nilai ekspektasi rata-rata sample sama dengan nilai sesungguhnya di populasi. Ini adalah karakteristik dari pengambilan sampel secara berulang kali atau repeated sampling. Untuk setiap sampel, rata-rata sampelnya bisa lebih tinggi atau lebih rendah dari nilai sesungguhnya. Secara rata-rata, nilainya akan mendekati nilai sesungguhnya.

** Ambil 500 sampel acak 

global simulation 500

global samplesize 30 gen Xhat30 = .

** Ambil 500 sampel acak yang masing-masing berukuran 30

foreach i of numlist 1/$simulation {

qui gen random`i’ = runiform() 

sort random`i’

qui sum X if _n <= 30

qui replace Xhat30 = `r(mean)’ if _n == `i’

}

** Ambil 500 sampel acak yang masing-masing berukuran 500

foreach i of numlist 1/$simulation {

qui gen random`i’ = runiform() 

sort random`i’

qui sum X if _n <= 500

qui replace Xhat30 = `r(mean)’ if _n == `i’

}

** Ambil 500 sampel acak yang masing-masing berukuran 1000

foreach i of numlist 1/$simulation {

qui gen random`i’ = runiform() 

sort random`i’

qui sum X if _n <= 1000

qui replace Xhat30 = `r(mean)’ if _n == `i’

}

** hitung nilai ekspektasi dari masing-masing sampel

sum Xhat30 Xhat500 Xhat1000

** buat grafik sampling distribution

tw (kdensity Xhat30) (kdensity Xhat500) (kdensity Xhat1000) /// , legend(pos(6) row(1) order(1 “s.s. 30” 2 “s.s. 500” 3 “s.s. 1000”)) /// xline(4) xtitle(“sample average”)

** ekspor grafik ke file png

graph export samplingdistribution.png, replace

Grafik menjelaskan bahwa rata-rata sampel dekat dengan nilai sesungguhnya, yaitu 4.  Grafik juga menjelaskan bahwa semakin besar jumlah sampel untuk estimasi, semakin sempt distribusi dari rata-rata sampel di sekitar nilai sesungguhnya. Ini adalah karakteristik utama dari sampling distribution.

samplingdistribution

Cheers,

GS

Ordinary least square (OLS) adalah salah satu topik yang mahasiwa ilmu ekonomi pelajari di mata kuliah ekonometrika. Metode ini berguna untuk mengestimasi pengaruh suatu variabel (X) terhadap suatu hasil (Y). Sebagai contoh, kita dapat menggunakan OLS untuk estimasi pengaruh capaian pendidikan (\beta_{1}.) terhadap upah di pasar tenaga kerja. Hasil estimasi dapat menjadi input bagi pengambil kebijakan sehingga mereka dapat menginvestasikan sumberdaya ke program yang memberikan imbal sosial yang tinggi.

Pengajaran OLS di kelas cukup menantang. Mahasiswa perlu memahami dengan baik asumsi-asumsi untuk mendapatkan hasil estimasi \beta_{1}. yang tidak bias. Pemahaman tersebut tidak sekedar hafalan formula dari asumsi tersebut namun juga konsekuensi dari pemenuhan asumsi tersebut. Namun demikian, sebagian besar mahasiswa gagal memahami dengan baik asumsi-asumsi untuk estimasi \beta_{1}. yang tidak bias, khususnya asumsi zero conditional mean. Asumsi ini menjelaskan bahwa variabel penjelas X tidak berkorelasi dengan faktor-faktor yang tidak kita observasi u, E[u_{i}\mid X_{i}]=0..

Kegagalan ini tercermin pada saat mahasiswa menggunakan OLS sebagai metode di skripsi. Mahasiswa seringkali lupa akan konsekuensi dari estimasi OLS yang tidak memenuhi asumsi zero conditional mean. Dalam beberapa kasus, mahasiswa lupa sama sekali asumsi tersebut. Oleh karena itu, penting bagi pengajar untuk melakukan inovasi agar mahasiswa dapat memahami asumsi ini dengan baik.

Salah satu pendekatan yang cukup baik untuk memahami asumsi zero conditional mean adalah simulasi. Mahasiswa dapat memahami dengan baik konsep fungsi regresi di populasi, pengambilan sampel secara acak, hasil estimasi OLS dengan sampel yang representatif, dan konsekuensi dari estimasi OLS yang tidak memenuhi asumsi tersebut.

Saya menggunakan peranti lunak Stata untuk melakukan simulasi tersebut. Mulailah dengan lembar kerja baru di Stata.

** Tentukan jumlah unit di populasi

set obs 1000

set seed 1829

** buatlah variabel acak dari distribusi seragam

gen X = 5*runiform()

** anda juga bisa membuat variabel penjelas berupa dumi

gen T = rbinomial(1,0.50)

** buatlah error acak yang tidak berkorelasi dengan

gen U = rnormal()

** simulasikan model sesungguhnya (populasi)

gen Y = 5 + 10*X + 5*U

** buatlah variabel acak untuk memilih 500 sampel secara acak

gen random = runiform()

sort random

** regresi Y terhadap X dengan 500 sampel secara acak

reg Y X if _n <= 500

** uji apakah hasil koefisien X berbeda dari 10 (nilai di populasi)

test X = 10

Hasil estimasi pengaruh X terhadap Y tidak bias karena kita mengambil sampel secara acak dari populasi dan asumsi zero conditional mean terpenuhi. Kita akan belajar konsekuensi dari estimasi OLS yang tidak memenuhi asumsi zero conditional mean.

** variabel X berkorelasi dengan error

replace X = 5*runiform() + 3*U

** simulasi nilai Y

replace Y = 5 + 10*X + 5*U

** regresi Y terhadap X dengan 500 sampel secara acak

reg Y X if _n <= 500

** uji apakah hasil estimasi berbeda dari nilai populasi

test X = 10

** bagaimana jika korelasi antara X dan error negatif?

** lakukan prosedur diatas dengan X = 5*runiform() – 3*U

Hasil estimasi koefisien X bias dan bias bergantung pada korelasi antara X dan U. Intuisi tentang permasalahan ini juga dapat kita lihat pada regresi multivariat.

** hasilkan dua variabel acak

replace X = 5*runiform()

gen S = 10*runiform()

** hasilkan variabel V yang berkorelasi dengan X

gen V = 5*runiform() + 3*X

** simulasi nilai Y

replace Y = 5 + 10*X + 4*S + 8*V + 5*U

** regresi model Y terhadap T, apakah hasil estimasi bias?

reg Y X if _n <= 500

** Apakah penambahan variabel S membantu?

reg Y X S if _n <= 500

Hasil estimasi koefisien X bias dan penambahan variabel S tidak membantu karena S tidak berkorelasi dengan X. Namun demikian, penambahan S menurunkan eror standar dari estimasi koefisien. Simulasi dengan 30 atau 100 sampel acak sebanyak 100 kali tetap menghasilkan koefisien yang bias.

density30

Simulasi dengan sampel berukuran 30 sebanyak 100 kali

density100

Simulasi dengan sampel berukuran 100 sebanyak 100 kali

Tentunya kita tidak dapat mengetahui dengan pasti nilai koefisien yang sesungguhnya. Oleh karena itu, sulit bagi kita untuk memastikan apakah hasil estimasi koefisien OLS kita bias atau tidak. Namun demikian, kita tetap dapat menggunakan penalaran untuk memastikan bahwa asumsi zero conditional mean kita terpenuhi. Harapan penulis adalah mahasiswa dapat kritis tentang model regresi yang mereka susun dan apakah asumsi-asumsi kunci OLS terpenuhi.

Best,
GS

I’m going to hold training sessions in the first week of every month in J-PAL Southeast Asia at LPEM FE UI. There are two training courses: quasi-experimental methods (Friday 9am) and data analysis with Stata (Thursday 9am). The training on quasi-experimental methods discuss causal inference, regression discontinuity design, matching, instrumental variable, and difference-in-differences. The data analysis with Stata reviews the basics of conducting statistical routines, creating graphics, and regression analyses.

Please see the syllabus attached in this post. Please email me at gsahadewo@povertyactionlab.org if you’re interested in coming to the training sessions.

Cheers!

syllabus_data_analysis_with_STATA

syllabus_quasi_experiment_method

I finally had a chance to visit Aceh for the first time. I travelled with J-PAL SEA training team to conduct impact evaluation training with academics and government officials. Every cup of coffee that was served to me was amazing. What surprised me the most was the Acehnese cuisine especially ayam tangkap (fried chicken and curry leaves), plik u (vegetable gravy with fermented coconut sauce). The team and I also visited the tsunami museum, and there I learned the magnitude of the disaster. I pay sympathy to the victims of the disaster and their families.

GS

aceh-1

The Baiturrahman Great Mosque that stood tall during the tsunami

aceh-2

The eye: the ceiling of the great mosque

aceh-4

A unique view of a group prayer

aceh-5

The memory of Aceh

Steve McCurry inspired me with his photographs of people in India. I was so excited when I eventually got a chance to visit Agra, India. The trip to Agra was part of a 6-day visit to India for J-PAL global staff training. Agra was quite a lovely place with so many colorful moments. I can't wait for another chance to visit India. I would say that Agra was one of the most memorable travel I've ever experienced. The experiences were a one-off and they were quite unique. Dresses and gowns that people wore were just colorful and amazing. The people are quite open and are willing to volunteer for photographs. Great experience

Cheers,

GS

  37237670901_74eff38fb1_z 37208305872_a73e2fa622_z 37190722686_52d366e5ce_z 37379938705_1f17f354db_z 37190735756_f991598b18_z    

“Korelasi tidak berarti kausalitas (correlation does not imply causation)”

Pepatah tersebut tentunya tidak asing lagi bagi mahasiswa yang telah mengambil mata kuliah statistika inferensi dan ekonometrika. Namun demikian, penulis sering menyaksikan mahasiswa menggunakan istilah dampak dalam diskusi, presentasi, dan tulisan padahal dampak menjelaskan kausalitas. Mahasiswa yang penulis pernah ampu tentu ingat beberapa momen di kala penulis menyampaikan salah kaprah ini di kelas. Tentunya, penulis tidak menghalangi penggunaan istilah tersebut. Namun demikian, penulis mengajak pembaca untuk menggunakan istilah tersebut dengan tepat. Tulisan ini mendiskusikan dengan singkat perbedaan antara korelasi dan dampak dalam intepretasi estimasian model ekonometrika.

Peneliti yang ingin mengestimasi pengaruh variabel terhadap variabel dapat menggunakan model ekonometrika sebagai berikut:

Y_{i}=\beta_{0}+\beta_{1}X_{i}+\Gamma\mathbf{Z}_{i}+u_{i}.

Asumsi utama adalah mean kondisional nol (zero conditional mean):

E[u_{i}\mid X_{i}]=0.

Peneliti dapat berargumen bahwa adalah eksogen jika asumsi ini dipertahankan. Sayangnya asumsi ini cukup kuat (too strong an assumption) sehingga asumsi ini seringkali tidak dapat dipertahankan. Penulis memberikan dua contoh yang menjelaskan kegagalan asumsi ini.

Pendapatan dan pendidikan

Peneliti menggunakan model pendapatan untuk mengestimasi imbal balik sekolah:

Y_{i}=\beta_{0}+\beta_{1}S_{i}+\Gamma\mathbf{Z}_{i}+u_{i}.

di mana adalah pendapatan dan S adalah pendidikan tertinggi. Vektor meliputi variabel kontrol seperti gender, fungsi polinomial pengalaman kerja, status pernikahan, variabel dumi untuk kependudukan, variabel dumi untuk jenis pekerjaan, pendapatan orang tua, dan pendidikan tertinggi orang tua. Peneliti terkadang tidak bisa mendapatkan semua variabel kontrol yang relevan seperti motivasi atau kemampuan bawaan.

Asumsi mean kondisional nol berimplikasi bahwa rata-rata kemampuan bawaan individu yang menyelesaikan SMA sama dengan rata-rata kemampuan bawaan individu yang lulus kuliah:

E[kemampuan\mid S=12]=E[kemampuan\mid S=16]=E[kemampuan\mid S=s].

Kenyataannya kemampuan bawaan individu lulusan kuliah seringkali berbeda dengan kemampuan bawaan individu lulusan SMA. Pembaca bisa berkonjektur bahwa kemampuan bawaan berkorelasi positif dengan tingkat pendidikan terakhir. Karena kemampuan bawaan terekam dalam variabel eror u, variabel eror berkorelasi dengan tingkat pendidikan S. Dalam konteks ini, kemampuan bawaan merupakan variabel pembaur (confounding variable).

Logika diatas menjelaskan pelanggaran asumsi mean kondisional nol. Konsekuensinya, estimasian \beta_{1} bias. Istilah yang pembaca kenal adalah bias variabel yang ditinggalkan atau omitted variable bias. Oleh karena itu, estimasian \beta_{1} tidak menjelaskan dampak pendidikan terhadap pendapatan, namun sekedar korelasi atau hubungan antara kedua variabel tersebut.

Penulis mengundang pembaca yang tertarik dengan estimasi imbal balik sekolah untuk membaca Angrist, Imbens, dan Rubin (1996) dan Card (2001).

Kausalitas Terbalik (Reverse Causality)

Asumsikan model hipotetikal tentang perkembangan sektor keuangan dan pertumbuhan ekonomi (Levine, 1997):

PPDB_{t}=\beta_{0}+\beta_{1}PSKEU_{t}+\Gamma\mathbf{Z}_{t}+u_{t}.

di mana menjelaskan waktu. Sektor keuangan yang semakin berkembang memudahkan perekonomian untuk mengakumulasi kapital, dan akumulasi kapital akan mendorong pertumbuhan ekonomi. Namun demikian, pertumbuhan ekonomi yang baik memberikan insentif untuk perkembangan sektor keuangan yang berkelanjutan. Situasi ini disebut dengan kausalitas terbalik. Dengan kata lain, variabel perkembangan sektor keuangan endogen dan estimasi parameternya bias. Oleh karena itu, estimasian parameter perkembangan sektor keuangan menjelaskan korelasi, bukan dampak.

Kegagalan asumsi mean kondisional nol dapat kita amati di berbagai topik penelitian. Oleh karena itu, berbagai peneliti terus mengembangkan model ekonometrika untuk mengidentifikasi suatu dampak. Topik penelitian yang pernah melewati debat ini antara lain topik kualitas sekolah dan tingkat pendidikan, kualitas sekolah dan pendapatan (Card dan Krueger, 1994), premium pendapatan untuk lelaki yang menikah, aktivitas peredaran narkotik dan tingkat pembunuhan (Castillo, Meija, Restrepo, 2013), upah minimum dan insiden pekerja informal (Hohberg dan Lay, 2015), dan ratusan topik penelitian lainnya.

Pengambil kebijakan tentunya ingin mendapatkan informasi mengenai dampak kausal suatu variabel terhadap keluaran ekonomi tertentu. Selain itu, pengambil kebijakan ingin mengetahui besaran dampak kausalnya. Namun demikian, peneliti tidak setiap waktu memiliki hak istimewa untuk mendapatkan data yang memungkinkan analisis dampak kausal. Sebagai catatan, penelitian mengenai korelasi variabel-variabel juga penting bagi literatur sehingga nilai ekonomis penelitian ini tetap tinggi. Akhir kata, penulis mengajak pembaca untuk berhati-hati dalam menggunakan dampak dalam penulisannya sehingga penggunaannya tepat sesuai dengan kaidah ekonometrika.

Referensi

Angrist, J. D., Imbens, G. W., & Rubin, D. B. (1996). Identification of causal effects using instrumental variables. Journal of the American statistical Association91(434), 444-455.

Card, D., & Krueger, A. (1994). The economic return to school quality: A partial survey (No. 713). Princeton University, Department of Economics, Industrial Relations Section..

Card, D. (2001). Estimating the return to schooling: Progress on some persistent econometric problems. Econometrica69(5), 1127-1160.

Castillo, J. C., Mejia, D., & Restrepo, P. (2013). Illegal drug markets and violence in Mexico: The causes beyond Calderón. Versión electronica: http://cie. itam. mx/SEMINARIOS/Marzo Mayo_2013/Mejia. pdf3(10), 2013.

Hohberg, M., & Lay, J. (2015). The impact of minimum wages on informal and formal labor market outcomes: evidence from Indonesia. IZA Journal of labor & Development4(1), 14.

Levine, R. (1997). Financial development and economic growth: views and agenda. Journal of economic literature35(2), 688-726.