Gabungkan daftar dalam kerangka data python

Metode merge()_ memperbarui konten dari dua DataFrame dengan menggabungkannya, menggunakan metode yang ditentukan

Gunakan parameter untuk mengontrol nilai mana yang akan dipertahankan dan mana yang akan diganti


Sintaksis

kerangka data. gabungkan (kanan, bagaimana, aktif, kiri_di, kanan_di, indeks_kiri, indeks_kanan, urutkan, sufiks, salin, indikator, validasi)

Untuk menggabungkan daftar panda dataframe menjadi satu dataframe dengan Python, Anda harus menggunakan fungsi merge(). Fungsi ini mengambil dua atau lebih kerangka data sebagai masukan dan mengembalikan satu kerangka data baru dari daftar tipe. Menggabungkan daftar kerangka data panda menjadi satu kerangka data dengan Python itu mudah. Dalam tutorial ini, kita akan belajar bagaimana menggabungkan daftar panda dataframe menjadi satu dataframe dengan python

*Bekerja di Jupyter Notebook Anaconda Environment

Sebagai hasil dari penggabungan daftar DataFrames dengan label kolom yang identik menjadi satu DataFrame, setiap kolom DataFrame digabungkan menjadi yang lain sampai hanya tersisa satu DataFrame, yang memiliki informasi tentang semua bingkai data sebelumnya dalam daftar

Jika Anda ingin mempelajari lebih lanjut tentang Pemrograman python, kunjungi Tutorial Pemrograman Python

Gabungkan Bingkai Data Pandas Dengan Python

Pertama, kita harus membuat kumpulan data kita. Kami akan menggabungkan kedua kerangka data dengan membuat daftar kerangka data panda. Kita harus membuat objek untuk daftar untuk menampung kumpulan data yang digabungkan.  

Setelah itu, kami memanggil fungsi penggabungan dari panda untuk menggabungkan daftar kerangka data panda menjadi satu kerangka data di Python secara agregasi dengan fungsi pengurangan.  

Proses eksekusinya seperti ini

  • Pertama, buat dua atau lebih kerangka data di Pandas dengan mengimpor pustaka panda
  • Sekarang, dalam daftar, pegang kedua kerangka data
  • Sekarang impor fungsi pengurangan dari modul functools
  • Sekarang menggunakan fungsi pengurangan dalam agregasi dengan fungsi merge() untuk menggabungkan daftar kerangka data panda menjadi satu kerangka data dengan Python
  • Kedua kerangka data digabungkan dengan "on", yang menunjukkan bidang mana yang digabungkan.  
  • Gabungan bisa dalam, luar, kiri, atau kanan tergantung pada “bagaimana. ”
  • Cetak bingkai data gabungan menggunakan perintah cetak sederhana.  

import pandas as pd
flower=pd.DataFrame({'flower':['Red Ginger','Tree Poppy','passion flower','water lily'],'test':['similarities','accuracy','correctness','classification']},
                 index=[0,1,2,3])
test=pd.DataFrame({'flower':['Red Ginger','Tree Poppy','rose flower','sun flower'],'cluster':['cluster_1','cluster_2','cluster_3','cluster_4' ]},
                 index=[4,5,6,7])
merge_a_list = [flower, test]
from functools import reduce
merge_df = reduce(lambda flower, test:    
                    pd.merge(flower , test,
                             on = ["flower"],  
                             how = "outer"),
                    merge_a_list)
merge_df      

flowertestcluster0Red Gingersimilaritiescluster_11Tree Poppyaccuracycluster_22passion flowercorrectnessNaN3water lilyclassificationNaN4rose flowerNaNcluster_35sun flowerNaNcluster_4

Menggunakan fungsi Concat()

Anda dapat menggabungkan DataFrames dengan memanggil panda. concat( merge_a_list ) dengan panda. DataFrames dengan label kolom yang sama digabungkan dan memberikan satu kerangka data. Data DataFrame yang termasuk dalam label kolom yang sama digabungkan menjadi satu kolom oleh fungsi Concat(). Kolom di luar persimpangan akan kosong. Nilai "NaN" akan dikembalikan jika tidak ada nilai

import pandas as pd
flower=pd.DataFrame({'flower':['Red Ginger','Tree Poppy','passion flower','water lily'],'test':['similarities','accuracy','correctness','classification']},
                 index=[0,1,2,3])
test=pd.DataFrame({'flower':['Red Ginger','Tree Poppy','rose flower','sun flower'],'cluster':['cluster_1','cluster_2','cluster_3','cluster_4' ]},
                 index=[4,5,6,7])
merge_a_list = [flower, test]
merge = pd. concat(merge_a_list)
print(type(merge))
merge
_

<class 'pandas.core.frame.DataFrame'>
flowertestcluster0Red GingersimilaritiesNaN1Tree PoppyaccuracyNaN2passion flowercorrectnessNaN3water lilyclassificationNaN4Red GingerNaNcluster_15Tree PoppyNaNcluster_26rose flowerNaNcluster_37sun flowerNaNcluster_4

Kesimpulan

Di Halaman ini ada dua cara yang dibahas dengan contoh tentang cara menggabungkan daftar kerangka data panda menjadi satu kerangka data dengan Python. Kedua metode ini termasuk menggunakan fungsi merge() untuk menggabungkan bingkai data menjadi satu bingkai data dan menggunakan fungsi concat() untuk melakukannya.  

Pandas adalah alat khusus yang memungkinkan kita melakukan manipulasi data yang rumit secara efektif dan efisien. Di dalam panda, kami kebanyakan berurusan dengan kumpulan data dalam bentuk DataFrame. DataFrames adalah struktur data 2 dimensi dalam panda. DataFrames terdiri dari baris, kolom, dan data

Bagaimana cara menggabungkan daftar kerangka data menjadi satu kerangka data?

Kami diberi daftar DataFrames, dan kami perlu melakukan operasi sehingga semua DataFrames digabungkan bersama dan menghasilkan satu DataFrame

Untuk tujuan ini, pertama-tama kita akan membuat beberapa DataFrame dengan satu kolom umum, lalu kita akan menggabungkannya menggunakan DataFrame. menggabungkan() metode

Bagaimana cara menggabungkan daftar ke DataFrame dengan Python?

Untuk bergabung dengan daftar DataFrame, misalnya dfs , gunakan panda. fungsi concat(dfs) yang menggabungkan sembarang jumlah DataFrame menjadi satu.

Bagaimana cara menggabungkan daftar seri ke dalam DataFrame?

Dengan menggunakan panda. concat() Anda dapat menggabungkan objek panda misalnya beberapa seri sepanjang sumbu tertentu (bijaksana kolom atau baris) untuk membuat DataFrame. metode concat() membutuhkan beberapa params, untuk skenario kami, kami menggunakan daftar yang membutuhkan seri untuk digabungkan dan sumbu=1 untuk menentukan seri gabungan sebagai kolom, bukan baris.

Apa perbedaan antara gabungan () dan concat () di panda?

concat() cukup menumpuk beberapa DataFrame bersama-sama baik secara vertikal, atau jahitan secara horizontal setelah menyelaraskan pada index. . merge() pertama-tama menyelaraskan dua DataFrame 'kolom atau indeks umum yang dipilih, lalu mengambil kolom yang tersisa dari baris yang disejajarkan dari setiap DataFrame

Apa yang dilakukan gabungan () dengan Python?

Definisi dan Penggunaan. Metode merge() memperbarui konten dua DataFrame dengan menggabungkan keduanya , menggunakan metode yang ditentukan. Gunakan parameter untuk mengontrol nilai mana yang akan dipertahankan dan mana yang akan diganti.