Nghiên cứu ứng dụng công nghệ thông tin để phân tích, thống kê cơ sở dữ liệu nguồn gen lúa thuộc dự án phát triển ngân hàng gen cây trồng quốc gia, 2011-2015
Dự án phát triển Ngân hàng gen cây trồng Quốc gia giai đoạn 2011-2015 do Trung tâm Tài nguyên thực vật thưc hiện đã thu thập được 12.758 mẫu giống của 119 loại cây trồng trên toàn quốc. Trong đó, Lúa (Oryza sativa L.) là loại cây trồng thu thập được nhiều và đa dạng với số lượng 1.704 mẫu nguồn gen.
Hoạt động bảo tồn và sử dụng bền vững quỹ gen cây trồng đòi hỏi quá trình thu thâp, lưu trữ thông tin và sinh ra một lượng dữ liệu khổng lồ. Chính vì vậy, việc xây dựng hệ thống cơ sở dữ liệu có khả năng cung cấp dữ liệu có độ tin cây cao cho nhiều đối tượng sử dụng là một công việc không thể thiếu của hoạt động bảo tồn. Hiện tại, cơ sở dữ liệu của Trung tâm Tài nguyên thực vật bao gồm dữ liệu Lai lịch, Mô tả đánh giá ban đầu, Mô tả đánh giá chi tiết, Hình ảnh…được cung cấp từ các hoạt động bảo tồn. Đến nay đã có hàng triệu trường dữ liệu cho các Loại cây trồng khác nhau. Khối lượng dữ liệu ngày càng nhiều dẫn đến việc lưu trữ và phân tích, thống kê dữ liệu sẽ gặp phải những khiếm khuyết nhất định. Trước kia, việc nhập dữ liệu, thống kê dữ liệu thường được tiến hành thủ công và được đối soát theo bản mẫu gây mất rất nhiều thời gian, tiền của và công sức. Từ khi áp dụng công nghệ thông tin trong khâu xử lý và tổng hợp số liệu thống kê, thời gian xử lý và tổng hợp cho một cuộc điều tra được rút ngắn đáng kể. Hơn thế nữa, sử dụng các chương trình máy tính trong khâu xử lý và tổng hợp số liệu còn cho phép nâng cao được chất lượng số liệu thống kê thống qua các chương trình kiểm tra logic và sửa lỗi. Bài báo cáo đưa ra các khái niệm, công cụ hỗ trợ, phần mềm chuyên ngành để có thể giúp ích trong công tác tiền xử lý dữ liệu, phân tích, thống kê cơ sở dữ liệu nguồn gen Lúa thu thập và mô tả, đánh giá trong dự án phát triển ngân hàng gen cây trồng quốc gia (2011-2015)
Chi tiết: xem tại đây