Stata mengharapkan satu matriks atau tabel data dari satu lembar, dengan paling banyak satu baris teks di awal yang menentukan isi kolom
2. Cara mendapatkan informasi dari Excel ke Stata
Stata dapat langsung mengimpor data dari Excel (keduanya. xls dan. xlsx) file
Pilih File > Import > Excel Spreadsheet dari menu Stata
Lihat juga import excel untuk informasi lebih lanjut tentang cara mengimpor spreadsheet Excel langsung ke Stata
3. Metode lain untuk mentransfer informasi
3. 1 Salin dan tempel
Menggunakan komputer Windows atau Mac Anda,
- Mulai Excel
- Masukkan data dalam baris dan kolom atau baca di file yang disimpan sebelumnya
- Sorot data yang diinginkan, lalu pilih Edit dan klik Salin
- Mulai Stata dan buka Data Editor (ketik edit di Stata dot prompt)
- Tempel data ke editor dengan memilih Edit dan klik Tempel
Bagian berikut didasarkan pada materi yang aslinya ditulis oleh James Hardin, University of South Carolina, dan Ted Anagnoson, California State Los Angeles
- Luncurkan Excel dan baca di file Excel Anda
- Simpan sebagai file teks (dibatasi tab atau dipisahkan koma) dengan memilih File dan mengklik Simpan Sebagai. Jika nama file aslinya adalah nama file. xls, lalu simpan file dengan nama filename. txt atau nama file. csv. (Gunakan daftar Simpan sebagai jenis—menentukan ekstensi seperti. txt tidak cukup untuk menghasilkan file teks. )
- Keluar dari Excel jika Anda mau
- Luncurkan Stata jika belum berjalan. (Jika Stata sudah berjalan, simpan atau hapus data Anda saat ini. )
- Di Stata, ketik import delimited using filename. ext, di mana nama file. ext adalah nama file yang baru saja Anda simpan di Excel. Berikan nama file lengkap, termasuk ekstensinya
- Di Stata, ketik kompres
- Simpan data sebagai dataset Stata menggunakan perintah simpan
3. 3 Beban ODBC dan ODBC
Bagian berikut disediakan oleh Kevin Turner, StataCorp
- Anda harus mengunduh dan menginstal driver ODBC Excel dari situs web Microsoft untuk bekerja dengan file Excel
- Luncurkan Stata
- Buat daftar sumber data ODBC yang telah ditentukan oleh Windows menggunakan perintah daftar odbc
- Klik daftar DSN (nama sumber data) yang disediakan oleh daftar odbc untuk menanyakan DSN tersebut. daftar odbc kemudian akan mencantumkan entri default yang disebut "File Excel" yang dapat Anda gunakan untuk memilih file Excel (*. xls) untuk dimuat melalui ODBC. Anda harus memilih file Excel setiap kali mengeluarkan perintah odbc menggunakan DSN ini. Anda juga dapat menentukan DSN Anda sendiri yang selalu mengarah ke file Excel tertentu. Di Windows, Anda akan menentukan DSN khusus ini melalui Panel Kontrol yang disebut "Alat Administratif", lalu pilih "Sumber Data (ODBC)". Lebih banyak dokumentasi tersedia dari Microsoft tentang cara menentukan Sumber Data Anda sendiri
- Klik lembar/tabel yang sesuai dengan data Anda di dalam file Excel untuk mendeskripsikan konten. Anda mungkin perlu mengeluarkan perintah permintaan odbc dengan opsi dialog (lengkap) jika Anda memilih file Excel arbitrer di daftar sebelumnya
- Jika Anda puas dengan deskripsi lembar/tabel sebelumnya, Anda dapat mengklik untuk memuat tabel yang dijelaskan
- Jika semuanya berjalan lancar, data Anda akan dimuat ke Stata. Namun demikian, ada beberapa alasan umum mengapa memuat Excel melalui ODBC mungkin bermasalah, dan itu tercakup di dalamnya
4. Menyalin grafik Stata ke Excel atau paket lainnya
Setelah Anda memiliki grafik yang sesuai di jendela Grafik Stata,
- Pilih Edit dan klik Salin Grafik
- Buka atau alihkan ke Excel dan pindah ke tempat Anda ingin menempelkan grafik
- Pilih Edit dan klik Tempel
Langkah-langkah ini juga harus bekerja di paket lain yang menerima masukan dengan cara ini
5. Masalah umum
Bagian berikut diambil dari materi oleh Ted Anagnoson, California State Los Angeles;
Masalah yang disebutkan di dalamnya terutama berkaitan dengan metode berbasis teks untuk mengimpor data dari Excel ke Stata, seperti menyalin dan menempel dan mengimpor data yang dibatasi. impor excel menangani sebagian besar masalah ini
5. 1 karakter nonnumerik
Satu sel berisi karakter nonnumerik, seperti huruf, di dalam kolom data sudah cukup bagi Stata untuk menjadikan variabel itu sebagai variabel string. Seringkali paling mudah untuk memperbaikinya di Excel. Di dalam Stata, misalkan variabel string yang bermasalah bernama foo. Berikut adalah tiga cara alternatif untuk mengidentifikasi pengamatan nakal
. tab foo if real(foo) == . . edit foo if real(foo) == . . list foo if real(foo) == .Jika sesuai, mereka dapat diganti dengan hilang, dan kemudian variabel secara keseluruhan dapat diubah menjadi numerik dengan mengetik
. replace foo = "" if real(foo) == . . gen newfoo = real(foo) . drop foo . rename newfoo foo _Anda juga bisa menggunakan destring
destring menyertakan opsi untuk menghapus koma, tanda dolar, tanda persen, dan karakter nonnumerik lainnya. Ini juga memungkinkan konversi data persentase secara otomatis
5. 2 Spasi
Apa yang tampak sebagai data numerik murni di Excel sering diperlakukan oleh Stata sebagai variabel string karena menyertakan spasi. Orang mungkin secara tidak sengaja memasukkan karakter spasi dalam sel yang kosong. Meskipun Excel menghapus spasi awal dan akhir dari entri numerik, Excel tidak memangkas spasi dari entri karakter. Satu atau lebih karakter spasi dengan sendirinya merupakan entri karakter yang valid dan disimpan seperti itu. Stata dengan patuh membaca seluruh kolom sebagai variabel string
Excel memiliki kemampuan pencarian dan penggantian yang memungkinkan Anda untuk menghapus spasi liar ini, atau Anda dapat menggunakan program pemrosesan teks atau editor teks pada file teks. Anda juga dapat menggunakan solusi di
5. 3 Format sel
Sebagian besar pemformatan di Excel mengganggu kemampuan Stata untuk menginterpretasikan data secara wajar. Tepat sebelum menyimpan data sebagai file teks, pastikan semua pemformatan dimatikan, setidaknya untuk sementara. Anda dapat melakukan ini dengan menyorot seluruh spreadsheet, memilih Format, lalu memilih Sel, dan mengeklik Umum
Namun, tidak ada solusi yang menyelesaikan semua masalah. Ini adalah kisah peringatan. Sebuah file teks termasuk data alamat. Satu kolom mencantumkan nomor rumah, dan beberapa lainnya berbentuk 4/2. Excel memutuskan beberapa tanggal ini dan mengonversinya menjadi 4 Februari. Menyetel semua sel ke format Umum tidak membantu karena mengubah tanggal yang tidak diinginkan ini menjadi 5 digit kode tanggal Excel. Salah satu solusinya adalah dengan menerapkan format Teks ke kolom yang bermasalah saat ditawarkan opsi selama proses impor teks Excel. Tetapi bahkan ini hanya berfungsi jika Anda memiliki beberapa kolom yang dapat dikelola untuk dilihat dan menyadari kemungkinan masalahnya
5. 4 Nama variabel
Stata membatasi nama variabel hingga 32 karakter dan tidak mengizinkan karakter apa pun yang digunakannya sebagai operator atau pembatas. Juga, nama variabel harus dimulai dengan huruf. Orang-orang yang merupakan pengguna Excel terlebih dahulu dan pengguna Stata kedua sering kali kreatif dengan nama yang mereka terapkan pada kolom. Stata mengonversi nama kolom (bidang) ilegal menjadi label dan membuat tebakan terbaik pada nama variabel yang masuk akal. Tebakan terbaik Stata, bagaimanapun, mungkin tidak sebagus nama yang dipilih pengguna karena mengetahui batasan penamaan Stata
Misalnya, Stata akan membuat nama variabel menggunakan 32 karakter pertama dari nama variabel dan menggunakan sisanya untuk label. Jika 32 karakter pertama tidak unik, kejadian selanjutnya akan disebut var1, var2, dll. , atau v1, v2, dll. (Jika Anda menempelkan data, variabel rintisan adalah var; jika Anda menggunakan insheet, rintisannya adalah v, jadi berhati-hatilah saat menulis file do-file. )
5. 5 Baris dan kolom yang hilang
Stata benar-benar mengabaikan baris kosong dalam spreadsheet tetapi kolom tidak benar-benar kosong. Kolom yang benar-benar kosong dibaca sebagai variabel dengan nilai yang hilang untuk setiap pengamatan. Tentu saja, tidak ada salahnya dilakukan dalam kedua kasus tersebut, tetapi pengguna spreadsheet yang ingin menambahkan kolom dan/atau baris kosong untuk meningkatkan keterbacaan mungkin ingin mencatat perbedaan ini
Sebaiknya baris pertama data lengkap tanpa ada data yang hilang. Jika perlu, tambahkan baris dummy dengan setiap nilai yang ada, lalu satu kali dalam tipe Stata
. drop in 1Perintah orang hilang oleh Nicholas J. Cox, yang memungkinkan variabel atau pengamatan yang semuanya hilang dengan mudah dibuang, diterbitkan di Stata Journal 15(4). Ketik search dm0085 untuk informasi tentang perintah ini
5. 6 Nol di depan
Dengan kode seperti bilangan bulat, seperti kode ICD-9 atau U. S. Nomor Jaminan Sosial, yang tidak mengandung tanda hubung, angka nol di depan akan dihapus saat ditempelkan ke Stata dari Excel. Salah satu solusinya adalah menandai variabel sebagai string di baris pertama. tambahkan karakter nonnumerik di Excel pada baris tersebut, lalu hapus di Stata
Nol di depan yang hilang juga dapat diganti dalam konversi ke string dengan satu baris perintah Stata;
. gen svar = string(nvar, "%012.0f") _Argumen kedua di sisi kanan perintah ini adalah format yang menentukan nol di depan pada konversi nvar ke string yang setara. Untuk detail lebih lanjut tentang format, lihat format
5. 7 Nama file dan folder
Konfirmasikan nama file dan lokasi file yang Anda coba baca. Gunakan Explorer atau yang setara untuk memeriksa
Misalnya, Anda mungkin secara tidak sengaja membuat file bernama nama file. txt. txt, atau lebih umum, nama yang diakhiri dengan dua ekstensi, yang mungkin atau mungkin bukan ekstensi yang sama. Penamaan ini dimungkinkan jika Anda memiliki opsi yang dicentang di Windows Explorer di bawah Tampilan, Opsi Folder untuk menyembunyikan ekstensi file untuk jenis file yang dikenal atau terdaftar. Ganti nama file secara manual, atau gunakan nama file yang benar dalam perintah Stata Anda. Anda mungkin juga ingin menghapus centang opsi ini untuk menghindari kesalahan serupa di masa mendatang