Mengkonversi excel ke file data

Stata mengharapkan satu matriks atau tabel data dari satu lembar, dengan paling banyak satu baris teks di awal yang menentukan isi kolom

2. Cara mendapatkan informasi dari Excel ke Stata

Stata dapat langsung mengimpor data dari Excel (keduanya. xls dan. xlsx) file

Pilih File > Import > Excel Spreadsheet dari menu Stata

Lihat juga import excel untuk informasi lebih lanjut tentang cara mengimpor spreadsheet Excel langsung ke Stata

3. Metode lain untuk mentransfer informasi

3. 1 Salin dan tempel

Menggunakan komputer Windows atau Mac Anda,

  1. Mulai Excel
  2. Masukkan data dalam baris dan kolom atau baca di file yang disimpan sebelumnya
  3. Sorot data yang diinginkan, lalu pilih Edit dan klik Salin
  4. Mulai Stata dan buka Data Editor (ketik edit di Stata dot prompt)
  5. Tempel data ke editor dengan memilih Edit dan klik Tempel

Bagian berikut didasarkan pada materi yang aslinya ditulis oleh James Hardin, University of South Carolina, dan Ted Anagnoson, California State Los Angeles

  1. Luncurkan Excel dan baca di file Excel Anda
  2. Simpan sebagai file teks (dibatasi tab atau dipisahkan koma) dengan memilih File dan mengklik Simpan Sebagai. Jika nama file aslinya adalah nama file. xls, lalu simpan file dengan nama filename. txt atau nama file. csv. (Gunakan daftar Simpan sebagai jenis—menentukan ekstensi seperti. txt tidak cukup untuk menghasilkan file teks. )
  3. Keluar dari Excel jika Anda mau
  4. Luncurkan Stata jika belum berjalan. (Jika Stata sudah berjalan, simpan atau hapus data Anda saat ini. )
  5. Di Stata, ketik import delimited using filename. ext, di mana nama file. ext adalah nama file yang baru saja Anda simpan di Excel. Berikan nama file lengkap, termasuk ekstensinya
  6. Di Stata, ketik kompres
  7. Simpan data sebagai dataset Stata menggunakan perintah simpan

3. 3 Beban ODBC dan ODBC

Bagian berikut disediakan oleh Kevin Turner, StataCorp

  1. Anda harus mengunduh dan menginstal driver ODBC Excel dari situs web Microsoft untuk bekerja dengan file Excel
  2. Luncurkan Stata
  3. Buat daftar sumber data ODBC yang telah ditentukan oleh Windows menggunakan perintah daftar odbc
  4. Klik daftar DSN (nama sumber data) yang disediakan oleh daftar odbc untuk menanyakan DSN tersebut. daftar odbc kemudian akan mencantumkan entri default yang disebut "File Excel" yang dapat Anda gunakan untuk memilih file Excel (*. xls) untuk dimuat melalui ODBC. Anda harus memilih file Excel setiap kali mengeluarkan perintah odbc menggunakan DSN ini. Anda juga dapat menentukan DSN Anda sendiri yang selalu mengarah ke file Excel tertentu. Di Windows, Anda akan menentukan DSN khusus ini melalui Panel Kontrol yang disebut "Alat Administratif", lalu pilih "Sumber Data (ODBC)". Lebih banyak dokumentasi tersedia dari Microsoft tentang cara menentukan Sumber Data Anda sendiri
  5. Klik lembar/tabel yang sesuai dengan data Anda di dalam file Excel untuk mendeskripsikan konten. Anda mungkin perlu mengeluarkan perintah permintaan odbc dengan opsi dialog (lengkap) jika Anda memilih file Excel arbitrer di daftar sebelumnya
  6. Jika Anda puas dengan deskripsi lembar/tabel sebelumnya, Anda dapat mengklik untuk memuat tabel yang dijelaskan
  7. Jika semuanya berjalan lancar, data Anda akan dimuat ke Stata. Namun demikian, ada beberapa alasan umum mengapa memuat Excel melalui ODBC mungkin bermasalah, dan itu tercakup di dalamnya

4. Menyalin grafik Stata ke Excel atau paket lainnya

Setelah Anda memiliki grafik yang sesuai di jendela Grafik Stata,

  1. Pilih Edit dan klik Salin Grafik
  2. Buka atau alihkan ke Excel dan pindah ke tempat Anda ingin menempelkan grafik
  3. Pilih Edit dan klik Tempel

Langkah-langkah ini juga harus bekerja di paket lain yang menerima masukan dengan cara ini

5. Masalah umum

Bagian berikut diambil dari materi oleh Ted Anagnoson, California State Los Angeles;

Masalah yang disebutkan di dalamnya terutama berkaitan dengan metode berbasis teks untuk mengimpor data dari Excel ke Stata, seperti menyalin dan menempel dan mengimpor data yang dibatasi. impor excel menangani sebagian besar masalah ini

5. 1 karakter nonnumerik

Satu sel berisi karakter nonnumerik, seperti huruf, di dalam kolom data sudah cukup bagi Stata untuk menjadikan variabel itu sebagai variabel string. Seringkali paling mudah untuk memperbaikinya di Excel. Di dalam Stata, misalkan variabel string yang bermasalah bernama foo. Berikut adalah tiga cara alternatif untuk mengidentifikasi pengamatan nakal

        . tab foo if real(foo) == .
        . edit foo if real(foo) == .
        . list foo if real(foo) == .

Jika sesuai, mereka dapat diganti dengan hilang, dan kemudian variabel secara keseluruhan dapat diubah menjadi numerik dengan mengetik

        . replace foo = "" if real(foo) == .
        . gen newfoo = real(foo)
        . drop foo 
        . rename newfoo foo
_

Anda juga bisa menggunakan destring

        . destring foo, replace

destring menyertakan opsi untuk menghapus koma, tanda dolar, tanda persen, dan karakter nonnumerik lainnya. Ini juga memungkinkan konversi data persentase secara otomatis

5. 2 Spasi

Apa yang tampak sebagai data numerik murni di Excel sering diperlakukan oleh Stata sebagai variabel string karena menyertakan spasi. Orang mungkin secara tidak sengaja memasukkan karakter spasi dalam sel yang kosong. Meskipun Excel menghapus spasi awal dan akhir dari entri numerik, Excel tidak memangkas spasi dari entri karakter. Satu atau lebih karakter spasi dengan sendirinya merupakan entri karakter yang valid dan disimpan seperti itu. Stata dengan patuh membaca seluruh kolom sebagai variabel string

Excel memiliki kemampuan pencarian dan penggantian yang memungkinkan Anda untuk menghapus spasi liar ini, atau Anda dapat menggunakan program pemrosesan teks atau editor teks pada file teks. Anda juga dapat menggunakan solusi di

5. 3 Format sel

Sebagian besar pemformatan di Excel mengganggu kemampuan Stata untuk menginterpretasikan data secara wajar. Tepat sebelum menyimpan data sebagai file teks, pastikan semua pemformatan dimatikan, setidaknya untuk sementara. Anda dapat melakukan ini dengan menyorot seluruh spreadsheet, memilih Format, lalu memilih Sel, dan mengeklik Umum

Namun, tidak ada solusi yang menyelesaikan semua masalah. Ini adalah kisah peringatan. Sebuah file teks termasuk data alamat. Satu kolom mencantumkan nomor rumah, dan beberapa lainnya berbentuk 4/2. Excel memutuskan beberapa tanggal ini dan mengonversinya menjadi 4 Februari. Menyetel semua sel ke format Umum tidak membantu karena mengubah tanggal yang tidak diinginkan ini menjadi 5 digit kode tanggal Excel. Salah satu solusinya adalah dengan menerapkan format Teks ke kolom yang bermasalah saat ditawarkan opsi selama proses impor teks Excel. Tetapi bahkan ini hanya berfungsi jika Anda memiliki beberapa kolom yang dapat dikelola untuk dilihat dan menyadari kemungkinan masalahnya

5. 4 Nama variabel

Stata membatasi nama variabel hingga 32 karakter dan tidak mengizinkan karakter apa pun yang digunakannya sebagai operator atau pembatas. Juga, nama variabel harus dimulai dengan huruf. Orang-orang yang merupakan pengguna Excel terlebih dahulu dan pengguna Stata kedua sering kali kreatif dengan nama yang mereka terapkan pada kolom. Stata mengonversi nama kolom (bidang) ilegal menjadi label dan membuat tebakan terbaik pada nama variabel yang masuk akal. Tebakan terbaik Stata, bagaimanapun, mungkin tidak sebagus nama yang dipilih pengguna karena mengetahui batasan penamaan Stata

Misalnya, Stata akan membuat nama variabel menggunakan 32 karakter pertama dari nama variabel dan menggunakan sisanya untuk label. Jika 32 karakter pertama tidak unik, kejadian selanjutnya akan disebut var1, var2, dll. , atau v1, v2, dll. (Jika Anda menempelkan data, variabel rintisan adalah var; jika Anda menggunakan insheet, rintisannya adalah v, jadi berhati-hatilah saat menulis file do-file. )

5. 5 Baris dan kolom yang hilang

Stata benar-benar mengabaikan baris kosong dalam spreadsheet tetapi kolom tidak benar-benar kosong. Kolom yang benar-benar kosong dibaca sebagai variabel dengan nilai yang hilang untuk setiap pengamatan. Tentu saja, tidak ada salahnya dilakukan dalam kedua kasus tersebut, tetapi pengguna spreadsheet yang ingin menambahkan kolom dan/atau baris kosong untuk meningkatkan keterbacaan mungkin ingin mencatat perbedaan ini

Sebaiknya baris pertama data lengkap tanpa ada data yang hilang. Jika perlu, tambahkan baris dummy dengan setiap nilai yang ada, lalu satu kali dalam tipe Stata

        . drop in 1

Perintah orang hilang oleh Nicholas J. Cox, yang memungkinkan variabel atau pengamatan yang semuanya hilang dengan mudah dibuang, diterbitkan di Stata Journal 15(4). Ketik search dm0085 untuk informasi tentang perintah ini

5. 6 Nol di depan

Dengan kode seperti bilangan bulat, seperti kode ICD-9 atau U. S. Nomor Jaminan Sosial, yang tidak mengandung tanda hubung, angka nol di depan akan dihapus saat ditempelkan ke Stata dari Excel. Salah satu solusinya adalah menandai variabel sebagai string di baris pertama. tambahkan karakter nonnumerik di Excel pada baris tersebut, lalu hapus di Stata

Nol di depan yang hilang juga dapat diganti dalam konversi ke string dengan satu baris perintah Stata;

        . gen svar = string(nvar, "%012.0f")
_

Argumen kedua di sisi kanan perintah ini adalah format yang menentukan nol di depan pada konversi nvar ke string yang setara. Untuk detail lebih lanjut tentang format, lihat format

5. 7 Nama file dan folder

Konfirmasikan nama file dan lokasi file yang Anda coba baca. Gunakan Explorer atau yang setara untuk memeriksa

Misalnya, Anda mungkin secara tidak sengaja membuat file bernama nama file. txt. txt, atau lebih umum, nama yang diakhiri dengan dua ekstensi, yang mungkin atau mungkin bukan ekstensi yang sama. Penamaan ini dimungkinkan jika Anda memiliki opsi yang dicentang di Windows Explorer di bawah Tampilan, Opsi Folder untuk menyembunyikan ekstensi file untuk jenis file yang dikenal atau terdaftar. Ganti nama file secara manual, atau gunakan nama file yang benar dalam perintah Stata Anda. Anda mungkin juga ingin menghapus centang opsi ini untuk menghindari kesalahan serupa di masa mendatang

Bisakah Excel diubah menjadi database?

Klik pada tab Databases, dan taruh file Excel Anda di kolom Select Table . Ini akan meluncurkan jendela yang memungkinkan Anda memverifikasi nama kolom Anda. Jika semuanya terlihat bagus, beri nama tabel, dan klik Buat Tabel. Kamu sudah selesai.

Bagaimana cara mengonversi file CSV ke file DAT?

Untuk mengonversi file CSV (Comma Separated Values) ke DAT, tetapkan nama file baru dengan ekstensi DAT menggunakan Notepad . Ada beberapa program perangkat lunak Internet yang dapat diunduh untuk melakukan konversi ini, tetapi Notepad menyediakan opsi gratis untuk mendapatkan hasil yang sama.

Bisakah Anda mengubah spreadsheet menjadi database?

Pada pita Office, pilih tab Data Eksternal dan klik Excel. Wisaya "Dapatkan Data Eksternal - Lembar Bentang Excel" muncul. Di bidang Nama file, telusuri ke file Excel. Pilih opsi "Impor data sumber ke tabel baru di basis data saat ini" dan klik OK