Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Bioinformatika (bahasa Inggris: bioinformatics) yaitu (ilmu yang mempelajari) penerapan teknik komputasional kepada mengelola dan menganalisis informasi biologis. Segi ini meliputi penerapan metode-metode matematika, statistika, dan informatika kepada memecahkan masalah-masalah biologis, terutama dengan memakai sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama segi ini meliputi basis data kepada mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur kepada meramalkan wujud struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Sejarah

Istilah bioinformatics mulai diketengahkan pada pertengahan era 1980-an kepada mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma kepada analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an.

Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein (sejak permulaan 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada penghabisan 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang bertambah cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka perlintasan untuk proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada penghabisannya menyebabkan lahirnya bioinformatika.

Perkembangan Internet juga mendukung menjadi bertambah sempurnanya bioinformatika. Basis data bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data tersebut maupun mendapat sekuens biologis sebagai bahan analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses program-program tersebut dan selanjutnya memudahkan pengembangannya.

Penerapan utama bioinformatika

Basis data sekuens biologis

Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis bisa berupa basis data primer kepada menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder kepada menyimpan motif sekuens protein, dan basis data struktur kepada menyimpan data struktur protein maupun asam nukleat.

Basis data utama kepada sekuens asam nukleat saat ini yaitu GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut memainkan pekerjaan sama dan bertukar data secara harian kepada menjaga kelonggaran cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat yaitu submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain mempunyai isinya sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.

Sementara itu, contoh sebagian basis data penting yang menyimpan sekuens primer protein yaitu PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya mempunyai isinya penjelasan mengenai fungsi protein tersebut.

BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan ketat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens memungkinkan ilmuwan kepada mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dipunyainya. Hal ini berarti misalnya kepada menemukan gen sejenis pada sebagian organisme atau kepada memeriksa keabsahan hasil sekuensing maupun kepada memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST yaitu penyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) yaitu basis data tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan jabatan atom-atom dalam protein ataupun asam nukleat.

Penyejajaran sekuens

Penyejajaran sekuens (sequence alignment) yaitu ronde penyusunan/pengaturan dua atau bertambah sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari ronde tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di selang sekuens-sekuens tersebut. Berikut yaitu contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kesamaan atau match di selang kedua sekuens).

ccat---caac | || |||| caatgggcaac


Sequence alignment merupakan cara dasar dalam analisis sekuens. Cara ini digunakan kepada mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan ronde mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan ronde insersi atau delesi. Sequence alignment memberikan hipotesis atas ronde evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa berlaku berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga bisa menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa berlaku penting untuk struktur atau fungsi protein tersebut.

Selain itu, sequence alignment juga digunakan kepada mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST yaitu salah satu cara alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST memakai algoritma heuristik dalam penyusunan alignment.

Sebagian cara alignment lain yang merupakan pendahulu BLAST yaitu cara "Needleman-Wunsch" dan "Smith-Waterman". Cara Needleman-Wunsch digunakan kepada menyusun alignment global di selang dua atau bertambah sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Cara Smith-Waterman berproduksi alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua cara tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif kepada alignment dua sekuens (pairwise alignment)

Clustal yaitu program bioinformatika kepada alignment multipel (multiple alignment), yaitu alignment sebagian sekuens sekaligus. Dua varian utama Clustal yaitu ClustalW dan ClustalX.

Cara lain yang bisa dilaksanakan kepada alignment sekuens yaitu cara yang berkomunikasi dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer kepada mengenali pembicaraan manusia (speech recognition). Selain digunakan kepada alignment, HMM juga digunakan dalam metode-metode analisis sekuens yang lain, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.

Prediksi struktur protein

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Model protein hemaglutinin dari virus influensa

Secara kimia/fisika, wujud struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR, namun kedua cara tersebut sangat memakan waktu dan relatif mahal. Sementara itu, cara sekuensing protein relatif bertambah mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein sesuai sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder sesuai struktur primer protein). Secara umum, cara prediksi struktur protein yang mempunyai saat ini bisa dikategorikan ke dalam dua golongan, yaitu cara pemodelan protein komparatif dan cara pemodelan de novo.

Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein sesuai struktur protein lain yang sudah dikenali. Salah satu penerapan cara ini yaitu pemodelan homologi (homology modelling), yaitu prediksi struktur tersier protein sesuai kesamaan struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog mempunyai struktur yang sangat mirip satu sama lain. Pada cara ini, struktur suatu protein (disebut protein target) dipastikan sesuai struktur protein lain (protein templat) yang sudah dikenali dan mempunyai kemiripan sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan komparatif yaitu protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens primer. Latar balik protein threading yaitu bahwa struktur protein bertambah dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang penting untuk fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang paling kompatibel kepada suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang mempunyai. Metode-metode yang tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut.

Dalam pendekatan de novo atau ab initio, struktur protein dipastikan dari sekuens primernya tanpa membandingkan dengan struktur protein lain. Terdapat jumlah kemungkinan dalam pendekatan ini, misalnya dengan menirukan ronde pelipatan (folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung memerlukan ronde komputasi yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein kecil. Sebagian usaha telah dilakukan kepada mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed computing, misalnya proyek Folding@home) maupun komputasi grid.

Analisis ekspresi gen

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Analisis klastering ekspresi gen pada kanker payudara

Ekspresi gen bisa dipastikan dengan mengukur kadar mRNA dengan beragam jenis teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya dilaksanakan pada analisis ekspresi gen skala agung yang mengukur ekspresi jumlah gen (bahkan genom) dan berproduksi data skala agung. Metode-metode penggalian data (data mining) dilaksanakan pada data tersebut kepada mendapat pola-pola informatif. Sebagai contoh, metode-metode komparasi digunakan kepada membandingkan ekspresi di selang gen-gen, sementara metode-metode klastering (clustering) digunakan kepada mempartisi data tersebut sesuai kesamaan ekspresi gen.

Bioinformatika di Indonesia

Saat ini mata segala sesuatu yang diajarkan bioinformatika maupun mata segala sesuatu yang diajarkan dengan muatan bioinformatika sudah diajarkan di sebagian perguruan tinggi di Indonesia. Sekolah Ilmu dan Teknologi Hayati ITB menawarkan mata kuliah "Pengantar Bioinformatika" kepada program Sarjana dan mata kuliah "Bioinformatika" kepada program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta menawarkan mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diajarkan pada Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia (UI), Jakarta. Mata kuliah "Proteomik dan Bioinformatika" termasuk dalam kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika termasuk di dalam silabus sebagian mata kuliah kepada program sarjana maupun pascasarjana biokimia,biologi, dan bioteknologi pada Institut Pertanian Bogor (IPB). Selain itu, riset-riset yang mengarah pada bioinformatika juga telah dilaksanakan oleh mahasiswa program S1 Ilmu Komputer maupun program pascasarjana biologi serta bioteknologi IPB.

Riset bioinformatika protein dilaksanakan sebagai bidang dari programa riset rekayasa protein pada Laboratorium Rekayasa Protein, Pusat Penelitian Bioteknologi Lembaga Ilmu Ilmu Indonesia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, secara khusus mempunyai laboratorium bioinformatika sebagai fasilitas prasarana penunjang programa risetnya. Selain itu, basis data sekuens DNA mikroorganisme asli Indonesia sedang dikembangkan di UI.

Lihat juga

Referensi dan bacaan lanjutan

  • (Inggris) Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • (Inggris) Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • (Inggris) Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala luar

  • (Inggris) Daftar pertanyaan yang sering muncul tentang bioinformatika
  • (Indonesia) Bioinformatika dan bioteknologi (oleh Arief B. Witarto, peneliti LIPI)
  • (Inggris) Jurnal Bioinformatics, salah satu jurnal ilmiah yang memfokuskan diri pada tema bioinformatika
  • (Inggris) International Society for Computational Biology (ISCB)
  • (Inggris) Asia Pacific Bioinformatics Network (APBioNet)
  • (Inggris) Tutorial bioinformatika kepada pemula (menggunakan alat-alat bioinformatika yang tersedia di Internet)
  • (Inggris) Download materi bioinformatika (S-Star Bioinformatics Education)
  • (Inggris) Planet.Bioinformatics | Agregasi blog bioinformatika
  • (Inggris) Linux / Unix biology software

Sumber :
id.wikipedia.org, sepakbola.biz, p2k.pahlawan.web.id, wiki.edunitas.com, dsb.


Page 2

Bioinformatika (bahasa Inggris: bioinformatics) yaitu (ilmu yang mempelajari) penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. Segi ini meliputi penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologis, terutama dengan memakai sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama segi ini meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan wujud struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Sejarah

Istilah bioinformatics mulai diketengahkan pada pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an.

Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein (sejak permulaan 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada penghabisan 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang bertambah cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka perlintasan bagi proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada penghabisannya menyebabkan lahirnya bioinformatika.

Perkembangan Internet juga mendukung menjadi bertambah sempurnanya bioinformatika. Basis data bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data tersebut maupun mendapat sekuens biologis sebagai bahan analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses program-program tersebut dan selanjutnya memudahkan pengembangannya.

Penerapan utama bioinformatika

Basis data sekuens biologis

Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis bisa berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur untuk menyimpan data struktur protein maupun asam nukleat.

Basis data utama untuk sekuens asam nukleat saat ini yaitu GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut memainkan pekerjaan sama dan bertukar data secara harian untuk menjaga kelonggaran cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat yaitu submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain mempunyai isinya sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.

Sementara itu, contoh sebagian basis data penting yang menyimpan sekuens primer protein yaitu PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya mempunyai isinya penjelasan mengenai fungsi protein tersebut.

BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan ketat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berarti misalnya untuk menemukan gen sejenis pada sebagian organisme atau untuk memeriksa keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST yaitu penyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) yaitu basis data tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan jabatan atom-atom dalam protein ataupun asam nukleat.

Penyejajaran sekuens

Penyejajaran sekuens (sequence alignment) yaitu ronde penyusunan/pengaturan dua atau bertambah sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari ronde tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di selang sekuens-sekuens tersebut. Berikut yaitu contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kesamaan atau match di selang kedua sekuens).

ccat---caac | || |||| caatgggcaac


Sequence alignment merupakan cara dasar dalam analisis sekuens. Cara ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan ronde mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan ronde insersi atau delesi. Sequence alignment memberikan hipotesis atas ronde evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa berlaku berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga bisa menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa berlaku penting bagi struktur atau fungsi protein tersebut.

Selain itu, sequence alignment juga digunakan untuk mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST yaitu salah satu cara alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST memakai algoritma heuristik dalam penyusunan alignment.

Sebagian cara alignment lain yang merupakan pendahulu BLAST yaitu cara "Needleman-Wunsch" dan "Smith-Waterman". Cara Needleman-Wunsch digunakan untuk menyusun alignment global di selang dua atau bertambah sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Cara Smith-Waterman berproduksi alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua cara tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment)

Clustal yaitu program bioinformatika untuk alignment multipel (multiple alignment), yaitu alignment sebagian sekuens sekaligus. Dua varian utama Clustal yaitu ClustalW dan ClustalX.

Cara lain yang bisa dilaksanakan untuk alignment sekuens yaitu cara yang berkomunikasi dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk alignment, HMM juga digunakan dalam metode-metode analisis sekuens yang lain, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.

Prediksi struktur protein

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Model protein hemaglutinin dari virus influensa

Secara kimia/fisika, wujud struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR, namun kedua cara tersebut sangat memakan waktu dan relatif mahal. Sementara itu, cara sekuensing protein relatif bertambah mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein sesuai sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder sesuai struktur primer protein). Secara umum, cara prediksi struktur protein yang mempunyai saat ini bisa dikategorikan ke dalam dua golongan, yaitu cara pemodelan protein komparatif dan cara pemodelan de novo.

Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein sesuai struktur protein lain yang sudah dikenali. Salah satu penerapan cara ini yaitu pemodelan homologi (homology modelling), yaitu prediksi struktur tersier protein sesuai kesamaan struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog mempunyai struktur yang sangat mirip satu sama lain. Pada cara ini, struktur suatu protein (disebut protein target) dipastikan sesuai struktur protein lain (protein templat) yang sudah dikenali dan mempunyai kemiripan sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan komparatif yaitu protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens primer. Latar balik protein threading yaitu bahwa struktur protein bertambah dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang penting bagi fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang mempunyai. Metode-metode yang tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut.

Dalam pendekatan de novo atau ab initio, struktur protein dipastikan dari sekuens primernya tanpa membandingkan dengan struktur protein lain. Terdapat jumlah kemungkinan dalam pendekatan ini, misalnya dengan menirukan ronde pelipatan (folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung memerlukan ronde komputasi yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein kecil. Sebagian usaha telah dilakukan untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed computing, misalnya proyek Folding@home) maupun komputasi grid.

Analisis ekspresi gen

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Analisis klastering ekspresi gen pada kanker payudara

Ekspresi gen bisa dipastikan dengan mengukur kadar mRNA dengan beragam jenis teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya dilaksanakan pada analisis ekspresi gen skala agung yang mengukur ekspresi jumlah gen (bahkan genom) dan berproduksi data skala agung. Metode-metode penggalian data (data mining) dilaksanakan pada data tersebut untuk mendapat pola-pola informatif. Sebagai contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di selang gen-gen, sementara metode-metode klastering (clustering) digunakan untuk mempartisi data tersebut sesuai kesamaan ekspresi gen.

Bioinformatika di Indonesia

Saat ini mata segala sesuatu yang diajarkan bioinformatika maupun mata segala sesuatu yang diajarkan dengan muatan bioinformatika sudah diajarkan di sebagian perguruan tinggi di Indonesia. Sekolah Ilmu dan Teknologi Hayati ITB menawarkan mata kuliah "Pengantar Bioinformatika" untuk program Sarjana dan mata kuliah "Bioinformatika" untuk program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta menawarkan mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diajarkan pada Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia (UI), Jakarta. Mata kuliah "Proteomik dan Bioinformatika" termasuk dalam kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika termasuk di dalam silabus sebagian mata kuliah untuk program sarjana maupun pascasarjana biokimia,biologi, dan bioteknologi pada Institut Pertanian Bogor (IPB). Selain itu, riset-riset yang mengarah pada bioinformatika juga telah dilaksanakan oleh mahasiswa program S1 Ilmu Komputer maupun program pascasarjana biologi serta bioteknologi IPB.

Riset bioinformatika protein dilaksanakan sebagai anggota dari programa riset rekayasa protein pada Laboratorium Rekayasa Protein, Pusat Penelitian Bioteknologi Lembaga Ilmu Pengetahuan Indonesia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, secara khusus mempunyai laboratorium bioinformatika sebagai fasilitas prasarana penunjang programa risetnya. Selain itu, basis data sekuens DNA mikroorganisme asli Indonesia sedang dikembangkan di UI.

Lihat juga

Referensi dan bacaan lanjutan

  • (Inggris) Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • (Inggris) Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • (Inggris) Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala luar

  • (Inggris) Daftar pertanyaan yang sering muncul tentang bioinformatika
  • (Indonesia) Bioinformatika dan bioteknologi (oleh Arief B. Witarto, peneliti LIPI)
  • (Inggris) Jurnal Bioinformatics, salah satu jurnal ilmiah yang memfokuskan diri pada tema bioinformatika
  • (Inggris) International Society for Computational Biology (ISCB)
  • (Inggris) Asia Pacific Bioinformatics Network (APBioNet)
  • (Inggris) Tutorial bioinformatika untuk pemula (menggunakan alat-alat bioinformatika yang tersedia di Internet)
  • (Inggris) Download materi bioinformatika (S-Star Bioinformatics Education)
  • (Inggris) Planet.Bioinformatics | Agregasi blog bioinformatika
  • (Inggris) Linux / Unix biology software

Sumber :
id.wikipedia.org, sepakbola.biz, p2k.pahlawan.web.id, wiki.edunitas.com, dsb.


Page 3

Bioinformatika (bahasa Inggris: bioinformatics) yaitu (ilmu yang mempelajari) penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologis. Segi ini meliputi penerapan metode-metode matematika, statistika, dan informatika untuk memecahkan masalah-masalah biologis, terutama dengan memakai sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama segi ini meliputi basis data untuk mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur untuk meramalkan wujud struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Sejarah

Istilah bioinformatics mulai diketengahkan pada pertengahan era 1980-an untuk mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma untuk analisis sekuens biologis) sudah dilakukan sejak tahun 1960-an.

Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein (sejak permulaan 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada penghabisan 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang bertambah cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka perlintasan untuk proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada penghabisannya menyebabkan lahirnya bioinformatika.

Perkembangan Internet juga mendukung menjadi bertambah sempurnanya bioinformatika. Basis data bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data tersebut maupun mendapat sekuens biologis sebagai bahan analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses program-program tersebut dan selanjutnya memudahkan pengembangannya.

Penerapan utama bioinformatika

Basis data sekuens biologis

Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis bisa berupa basis data primer untuk menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder untuk menyimpan motif sekuens protein, dan basis data struktur untuk menyimpan data struktur protein maupun asam nukleat.

Basis data utama untuk sekuens asam nukleat saat ini yaitu GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut memainkan pekerjaan sama dan bertukar data secara harian untuk menjaga kelonggaran cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat yaitu submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain mempunyai isinya sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.

Sementara itu, contoh sebagian basis data penting yang menyimpan sekuens primer protein yaitu PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya mempunyai isinya penjelasan mengenai fungsi protein tersebut.

BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan ketat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens memungkinkan ilmuwan untuk mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dimilikinya. Hal ini berarti misalnya untuk menemukan gen sejenis pada sebagian organisme atau untuk memeriksa keabsahan hasil sekuensing maupun untuk memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST yaitu penyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) yaitu basis data tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan jabatan atom-atom dalam protein ataupun asam nukleat.

Penyejajaran sekuens

Penyejajaran sekuens (sequence alignment) yaitu ronde penyusunan/pengaturan dua atau bertambah sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari ronde tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di selang sekuens-sekuens tersebut. Berikut yaitu contoh alignment DNA dari dua sekuens pendek DNA yang berlainan, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kesamaan atau match di selang kedua sekuens).

ccat---caac | || |||| caatgggcaac


Sequence alignment merupakan cara dasar dalam analisis sekuens. Cara ini digunakan untuk mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan ronde mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan ronde insersi atau delesi. Sequence alignment memberikan hipotesis atas ronde evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa berlaku berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga bisa menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa berlaku penting untuk struktur atau fungsi protein tersebut.

Selain itu, sequence alignment juga digunakan untuk mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST yaitu salah satu cara alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST memakai algoritma heuristik dalam penyusunan alignment.

Sebagian cara alignment lain yang merupakan pendahulu BLAST yaitu cara "Needleman-Wunsch" dan "Smith-Waterman". Cara Needleman-Wunsch digunakan untuk menyusun alignment global di selang dua atau bertambah sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Cara Smith-Waterman berproduksi alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua cara tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif untuk alignment dua sekuens (pairwise alignment)

Clustal yaitu program bioinformatika untuk alignment multipel (multiple alignment), yaitu alignment sebagian sekuens sekaligus. Dua varian utama Clustal yaitu ClustalW dan ClustalX.

Cara lain yang bisa dilaksanakan untuk alignment sekuens yaitu cara yang berkomunikasi dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer untuk mengenali pembicaraan manusia (speech recognition). Selain digunakan untuk alignment, HMM juga digunakan dalam metode-metode analisis sekuens yang lain, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.

Prediksi struktur protein

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Model protein hemaglutinin dari virus influensa

Secara kimia/fisika, wujud struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR, namun kedua cara tersebut sangat memakan waktu dan relatif mahal. Sementara itu, cara sekuensing protein relatif bertambah mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein sesuai sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder sesuai struktur primer protein). Secara umum, cara prediksi struktur protein yang mempunyai saat ini bisa dikategorikan ke dalam dua golongan, yaitu cara pemodelan protein komparatif dan cara pemodelan de novo.

Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein sesuai struktur protein lain yang sudah dikenali. Salah satu penerapan cara ini yaitu pemodelan homologi (homology modelling), yaitu prediksi struktur tersier protein sesuai kesamaan struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog mempunyai struktur yang sangat mirip satu sama lain. Pada cara ini, struktur suatu protein (disebut protein target) dipastikan sesuai struktur protein lain (protein templat) yang sudah dikenali dan mempunyai kemiripan sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan komparatif yaitu protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens primer. Latar balik protein threading yaitu bahwa struktur protein bertambah dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang penting untuk fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang paling kompatibel untuk suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang mempunyai. Metode-metode yang tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut.

Dalam pendekatan de novo atau ab initio, struktur protein dipastikan dari sekuens primernya tanpa membandingkan dengan struktur protein lain. Terdapat jumlah kemungkinan dalam pendekatan ini, misalnya dengan menirukan ronde pelipatan (folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung memerlukan ronde komputasi yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein kecil. Sebagian usaha telah dilakukan untuk mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed computing, misalnya proyek Folding@home) maupun komputasi grid.

Analisis ekspresi gen

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Analisis klastering ekspresi gen pada kanker payudara

Ekspresi gen bisa dipastikan dengan mengukur kadar mRNA dengan beragam jenis teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya dilaksanakan pada analisis ekspresi gen skala agung yang mengukur ekspresi jumlah gen (bahkan genom) dan berproduksi data skala agung. Metode-metode penggalian data (data mining) dilaksanakan pada data tersebut untuk mendapat pola-pola informatif. Sebagai contoh, metode-metode komparasi digunakan untuk membandingkan ekspresi di selang gen-gen, sementara metode-metode klastering (clustering) digunakan untuk mempartisi data tersebut sesuai kesamaan ekspresi gen.

Bioinformatika di Indonesia

Saat ini mata segala sesuatu yang diajarkan bioinformatika maupun mata segala sesuatu yang diajarkan dengan muatan bioinformatika sudah diajarkan di sebagian perguruan tinggi di Indonesia. Sekolah Ilmu dan Teknologi Hayati ITB menawarkan mata kuliah "Pengantar Bioinformatika" untuk program Sarjana dan mata kuliah "Bioinformatika" untuk program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta menawarkan mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diajarkan pada Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia (UI), Jakarta. Mata kuliah "Proteomik dan Bioinformatika" termasuk dalam kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika termasuk di dalam silabus sebagian mata kuliah untuk program sarjana maupun pascasarjana biokimia,biologi, dan bioteknologi pada Institut Pertanian Bogor (IPB). Selain itu, riset-riset yang mengarah pada bioinformatika juga telah dilaksanakan oleh mahasiswa program S1 Ilmu Komputer maupun program pascasarjana biologi serta bioteknologi IPB.

Riset bioinformatika protein dilaksanakan sebagai bidang dari programa riset rekayasa protein pada Laboratorium Rekayasa Protein, Pusat Penelitian Bioteknologi Lembaga Ilmu Ilmu Indonesia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, secara khusus mempunyai laboratorium bioinformatika sebagai fasilitas prasarana penunjang programa risetnya. Selain itu, basis data sekuens DNA mikroorganisme asli Indonesia sedang dikembangkan di UI.

Lihat pula

Referensi dan bacaan lanjutan

  • (Inggris) Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • (Inggris) Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • (Inggris) Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala luar

  • (Inggris) Daftar pertanyaan yang sering muncul tentang bioinformatika
  • (Indonesia) Bioinformatika dan bioteknologi (oleh Arief B. Witarto, peneliti LIPI)
  • (Inggris) Jurnal Bioinformatics, salah satu jurnal ilmiah yang memfokuskan diri pada tema bioinformatika
  • (Inggris) International Society for Computational Biology (ISCB)
  • (Inggris) Asia Pacific Bioinformatics Network (APBioNet)
  • (Inggris) Tutorial bioinformatika untuk pemula (menggunakan alat-alat bioinformatika yang tersedia di Internet)
  • (Inggris) Download materi bioinformatika (S-Star Bioinformatics Education)
  • (Inggris) Planet.Bioinformatics | Agregasi blog bioinformatika
  • (Inggris) Linux / Unix biology software

Sumber :
id.wikipedia.org, sepakbola.biz, p2k.pahlawan.web.id, wiki.edunitas.com, dsb.


Page 4

Bioinformatika (bahasa Inggris: bioinformatics) yaitu (ilmu yang mempelajari) penerapan teknik komputasional kepada mengelola dan menganalisis informasi biologis. Segi ini meliputi penerapan metode-metode matematika, statistika, dan informatika kepada memecahkan masalah-masalah biologis, terutama dengan memakai sekuens DNA dan asam amino serta informasi yang berkaitan dengannya. Contoh topik utama segi ini meliputi basis data kepada mengelola informasi biologis, penyejajaran sekuens (sequence alignment), prediksi struktur kepada meramalkan wujud struktur protein maupun struktur sekunder RNA, analisis filogenetik, dan analisis ekspresi gen.

Sejarah

Istilah bioinformatics mulai diketengahkan pada pertengahan era 1980-an kepada mengacu pada penerapan komputer dalam biologi. Namun demikian, penerapan bidang-bidang dalam bioinformatika (seperti pembuatan basis data dan pengembangan algoritma kepada analisis sekuens biologis) sudah diterapkan sejak tahun 1960-an.

Kemajuan teknik biologi molekular dalam mengungkap sekuens biologis dari protein (sejak permulaan 1950-an) dan asam nukleat (sejak 1960-an) mengawali perkembangan basis data dan teknik analisis sekuens biologis. Basis data sekuens protein mulai dikembangkan pada tahun 1960-an di Amerika Serikat, sementara basis data sekuens DNA dikembangkan pada penghabisan 1970-an di Amerika Serikat dan Jerman (pada European Molecular Biology Laboratory, Laboratorium Biologi Molekular Eropa). Penemuan teknik sekuensing DNA yang bertambah cepat pada pertengahan 1970-an menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada 1980-an dan 1990-an, menjadi salah satu pembuka perlintasan untuk proyek-proyek pengungkapan genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada penghabisannya menyebabkan lahirnya bioinformatika.

Perkembangan Internet juga mendukung menjadi bertambah sempurnanya bioinformatika. Basis data bioinformatika yang terhubung melalui Internet memudahkan ilmuwan mengumpulkan hasil sekuensing ke dalam basis data tersebut maupun mendapat sekuens biologis sebagai bahan analisis. Selain itu, penyebaran program-program aplikasi bioinformatika melalui Internet memudahkan ilmuwan mengakses program-program tersebut dan selanjutnya memudahkan pengembangannya.

Penerapan utama bioinformatika

Basis data sekuens biologis

Sesuai dengan jenis informasi biologis yang disimpannya, basis data sekuens biologis bisa berupa basis data primer kepada menyimpan sekuens primer asam nukleat maupun protein, basis data sekunder kepada menyimpan motif sekuens protein, dan basis data struktur kepada menyimpan data struktur protein maupun asam nukleat.

Basis data utama kepada sekuens asam nukleat saat ini yaitu GenBank (Amerika Serikat), EMBL (Eropa), dan DDBJ(Inggris) (DNA Data Bank of Japan, Jepang). Ketiga basis data tersebut memainkan pekerjaan sama dan bertukar data secara harian kepada menjaga kelonggaran cakupan masing-masing basis data. Sumber utama data sekuens asam nukleat yaitu submisi langsung dari periset individual, proyek sekuensing genom, dan pendaftaran paten. Selain mempunyai isinya sekuens asam nukleat, entri dalam basis data sekuens asam nukleat umumnya mengandung informasi tentang jenis asam nukleat (DNA atau RNA), nama organisme sumber asam nukleat tersebut, dan pustaka yang berkaitan dengan sekuens asam nukleat tersebut.

Sementara itu, contoh sebagian basis data penting yang menyimpan sekuens primer protein yaitu PIR (Protein Information Resource, Amerika Serikat), Swiss-Prot (Eropa), dan TrEMBL (Eropa). Ketiga basis data tersebut telah digabungkan dalam UniProt (yang didanai terutama oleh Amerika Serikat). Entri dalam UniProt mengandung informasi tentang sekuens protein, nama organisme sumber protein, pustaka yang berkaitan, dan komentar yang umumnya mempunyai isinya penjelasan mengenai fungsi protein tersebut.

BLAST (Basic Local Alignment Search Tool) merupakan perkakas bioinformatika yang berkaitan ketat dengan penggunaan basis data sekuens biologis. Penelusuran BLAST (BLAST search) pada basis data sekuens memungkinkan ilmuwan kepada mencari sekuens asam nukleat maupun protein yang mirip dengan sekuens tertentu yang dipunyainya. Hal ini berarti misalnya kepada menemukan gen sejenis pada sebagian organisme atau kepada memeriksa keabsahan hasil sekuensing maupun kepada memeriksa fungsi gen hasil sekuensing. Algoritma yang mendasari kerja BLAST yaitu penyejajaran sekuens.

PDB (Protein Data Bank, Bank Data Protein) yaitu basis data tunggal yang menyimpan model struktural tiga dimensi protein dan asam nukleat hasil penentuan eksperimental (dengan kristalografi sinar-X, spektroskopi NMR dan mikroskopi elektron). PDB menyimpan data struktur sebagai koordinat tiga dimensi yang menggambarkan jabatan atom-atom dalam protein ataupun asam nukleat.

Penyejajaran sekuens

Penyejajaran sekuens (sequence alignment) yaitu ronde penyusunan/pengaturan dua atau bertambah sekuens sehingga persamaan sekuens-sekuens tersebut tampak nyata. Hasil dari ronde tersebut juga disebut sebagai sequence alignment atau alignment saja. Baris sekuens dalam suatu alignment diberi sisipan (umumnya dengan tanda "–") sedemikian rupa sehingga kolom-kolomnya memuat karakter yang identik atau sama di selang sekuens-sekuens tersebut. Berikut yaitu contoh alignment DNA dari dua sekuens pendek DNA yang berbeda, "ccatcaac" dan "caatgggcaac" (tanda "|" menunjukkan kesamaan atau match di selang kedua sekuens).

ccat---caac | || |||| caatgggcaac


Sequence alignment merupakan cara dasar dalam analisis sekuens. Cara ini digunakan kepada mempelajari evolusi sekuens-sekuens dari leluhur yang sama (common ancestor). Ketidakcocokan (mismatch) dalam alignment diasosiasikan dengan ronde mutasi, sedangkan kesenjangan (gap, tanda "–") diasosiasikan dengan ronde insersi atau delesi. Sequence alignment memberikan hipotesis atas ronde evolusi yang terjadi dalam sekuens-sekuens tersebut. Misalnya, kedua sekuens dalam contoh alignment di atas bisa berlaku berevolusi dari sekuens yang sama "ccatgggcaac". Dalam kaitannya dengan hal ini, alignment juga bisa menunjukkan posisi-posisi yang dipertahankan (conserved) selama evolusi dalam sekuens-sekuens protein, yang menunjukkan bahwa posisi-posisi tersebut bisa berlaku penting untuk struktur atau fungsi protein tersebut.

Selain itu, sequence alignment juga digunakan kepada mencari sekuens yang mirip atau sama dalam basis data sekuens. BLAST yaitu salah satu cara alignment yang sering digunakan dalam penelusuran basis data sekuens. BLAST memakai algoritma heuristik dalam penyusunan alignment.

Sebagian cara alignment lain yang merupakan pendahulu BLAST yaitu cara "Needleman-Wunsch" dan "Smith-Waterman". Cara Needleman-Wunsch digunakan kepada menyusun alignment global di selang dua atau bertambah sekuens, yaitu alignment atas keseluruhan panjang sekuens tersebut. Cara Smith-Waterman berproduksi alignment lokal, yaitu alignment atas bagian-bagian dalam sekuens. Kedua cara tersebut menerapkan pemrograman dinamik (dynamic programming) dan hanya efektif kepada alignment dua sekuens (pairwise alignment)

Clustal yaitu program bioinformatika kepada alignment multipel (multiple alignment), yaitu alignment sebagian sekuens sekaligus. Dua varian utama Clustal yaitu ClustalW dan ClustalX.

Cara lain yang bisa dilaksanakan kepada alignment sekuens yaitu cara yang berkomunikasi dengan Hidden Markov Model ("Model Markov Tersembunyi", HMM). HMM merupakan model statistika yang mulanya digunakan dalam ilmu komputer kepada mengenali pembicaraan manusia (speech recognition). Selain digunakan kepada alignment, HMM juga digunakan dalam metode-metode analisis sekuens yang lain, seperti prediksi daerah pengkode protein dalam genom dan prediksi struktur sekunder protein.

Prediksi struktur protein

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Model protein hemaglutinin dari virus influensa

Secara kimia/fisika, wujud struktur protein diungkap dengan kristalografi sinar-X ataupun spektroskopi NMR, namun kedua cara tersebut sangat memakan waktu dan relatif mahal. Sementara itu, cara sekuensing protein relatif bertambah mudah mengungkapkan sekuens asam amino protein. Prediksi struktur protein berusaha meramalkan struktur tiga dimensi protein sesuai sekuens asam aminonya (dengan kata lain, meramalkan struktur tersier dan struktur sekunder sesuai struktur primer protein). Secara umum, cara prediksi struktur protein yang mempunyai saat ini bisa dikategorikan ke dalam dua golongan, yaitu cara pemodelan protein komparatif dan cara pemodelan de novo.

Pemodelan protein komparatif (comparative protein modelling) meramalkan struktur suatu protein sesuai struktur protein lain yang sudah dikenali. Salah satu penerapan cara ini yaitu pemodelan homologi (homology modelling), yaitu prediksi struktur tersier protein sesuai kesamaan struktur primer protein. Pemodelan homologi didasarkan pada teori bahwa dua protein yang homolog mempunyai struktur yang sangat mirip satu sama lain. Pada cara ini, struktur suatu protein (disebut protein target) dipastikan sesuai struktur protein lain (protein templat) yang sudah dikenali dan mempunyai kemiripan sekuens dengan protein target tersebut. Selain itu, penerapan lain pemodelan komparatif yaitu protein threading yang didasarkan pada kemiripan struktur tanpa kemiripan sekuens primer. Latar balik protein threading yaitu bahwa struktur protein bertambah dikonservasi daripada sekuens protein selama evolusi; daerah-daerah yang penting untuk fungsi protein dipertahankan strukturnya. Pada pendekatan ini, struktur yang paling kompatibel kepada suatu sekuens asam amino dipilih dari semua jenis struktur tiga dimensi protein yang mempunyai. Metode-metode yang tergolong dalam protein threading berusaha menentukan tingkat kompatibilitas tersebut.

Dalam pendekatan de novo atau ab initio, struktur protein dipastikan dari sekuens primernya tanpa membandingkan dengan struktur protein lain. Terdapat jumlah kemungkinan dalam pendekatan ini, misalnya dengan menirukan ronde pelipatan (folding) protein dari sekuens primernya menjadi struktur tersiernya (misalnya dengan simulasi dinamika molekular), atau dengan optimisasi global fungsi energi protein. Prosedur-prosedur ini cenderung memerlukan ronde komputasi yang intens, sehingga saat ini hanya digunakan dalam menentukan struktur protein-protein kecil. Sebagian usaha telah diterapkan kepada mengatasi kekurangan sumber daya komputasi tersebut, misalnya dengan superkomputer (misalnya superkomputer Blue Gene [1] dari IBM) atau komputasi terdistribusi (distributed computing, misalnya proyek Folding@home) maupun komputasi grid.

Analisis ekspresi gen

Penerapan bidang bidang pada bioinformatika sudah dilakukan sejak pertengahan tahun 1960-an yaitu

Analisis klastering ekspresi gen pada kanker payudara

Ekspresi gen bisa dipastikan dengan mengukur kadar mRNA dengan beragam jenis teknik (misalnya dengan microarray ataupun Serial Analysis of Gene Expression ["Analisis Serial Ekspresi Gen", SAGE]). Teknik-teknik tersebut umumnya dilaksanakan pada analisis ekspresi gen skala agung yang mengukur ekspresi jumlah gen (bahkan genom) dan berproduksi data skala agung. Metode-metode penggalian data (data mining) dilaksanakan pada data tersebut kepada mendapat pola-pola informatif. Sebagai contoh, metode-metode komparasi digunakan kepada membandingkan ekspresi di selang gen-gen, sementara metode-metode klastering (clustering) digunakan kepada mempartisi data tersebut sesuai kesamaan ekspresi gen.

Bioinformatika di Indonesia

Saat ini mata segala sesuatu yang diajarkan bioinformatika maupun mata segala sesuatu yang diajarkan dengan muatan bioinformatika sudah diajarkan di sebagian perguruan tinggi di Indonesia. Sekolah Ilmu dan Teknologi Hayati ITB menawarkan mata kuliah "Pengantar Bioinformatika" kepada program Sarjana dan mata kuliah "Bioinformatika" kepada program Pascasarjana. Fakultas Teknobiologi Universitas Atma Jaya, Jakarta menawarkan mata kuliah "Pengantar Bioinformatika". Mata kuliah "Bioinformatika" diajarkan pada Program Pascasarjana Kimia Fakultas MIPA Universitas Indonesia (UI), Jakarta. Mata kuliah "Proteomik dan Bioinformatika" termasuk dalam kurikulum program S3 bioteknologi Universitas Gadjah Mada (UGM), Yogyakarta. Materi bioinformatika termasuk di dalam silabus sebagian mata kuliah kepada program sarjana maupun pascasarjana biokimia,biologi, dan bioteknologi pada Institut Pertanian Bogor (IPB). Selain itu, riset-riset yang mengarah pada bioinformatika juga telah dilaksanakan oleh mahasiswa program S1 Ilmu Komputer maupun program pascasarjana biologi serta bioteknologi IPB.

Riset bioinformatika protein dilaksanakan sebagai bidang dari programa riset rekayasa protein pada Laboratorium Rekayasa Protein, Pusat Penelitian Bioteknologi Lembaga Ilmu Ilmu Indonesia (LIPI), Cibinong, Bogor. Lembaga Biologi Molekul Eijkman, Jakarta, secara khusus mempunyai laboratorium bioinformatika sebagai fasilitas prasarana penunjang programa risetnya. Selain itu, basis data sekuens DNA mikroorganisme asli Indonesia sedang dikembangkan di UI.

Lihat juga

Referensi dan bacaan lanjutan

  • (Inggris) Attwood, T.K., dan D.J. Parry-Smith. 1999. Introduction to Bioinformatics. Harlow: Pearson Education. ISBN 0-582-32788-1
  • (Inggris) Krane, D.E., dan M.L. Raymer. 2003. Fundamental Concepts of Bioinformatics. San Francisco: Benjamin Cummings. ISBN 0-8053-4633-3
  • (Inggris) Mount, D.W. 2001. Bioinformatics: Sequence and Genome Analysis. Cold Spring Harbor: Cold Spring Harbor Laboratory Press. ISBN 0-87969-608-7

Pranala luar

  • (Inggris) Daftar pertanyaan yang sering muncul tentang bioinformatika
  • (Indonesia) Bioinformatika dan bioteknologi (oleh Arief B. Witarto, peneliti LIPI)
  • (Inggris) Jurnal Bioinformatics, salah satu jurnal ilmiah yang memfokuskan diri pada tema bioinformatika
  • (Inggris) International Society for Computational Biology (ISCB)
  • (Inggris) Asia Pacific Bioinformatics Network (APBioNet)
  • (Inggris) Tutorial bioinformatika kepada pemula (menggunakan alat-alat bioinformatika yang tersedia di Internet)
  • (Inggris) Download materi bioinformatika (S-Star Bioinformatics Education)
  • (Inggris) Planet.Bioinformatics | Agregasi blog bioinformatika
  • (Inggris) Linux / Unix biology software

Sumber :
id.wikipedia.org, sepakbola.biz, p2k.pahlawan.web.id, wiki.edunitas.com, dsb.