Một số vấn đề về ứng dụng công nghệ thông tin trong nhận biết nguồn gen cây trồng

I. ĐẶT VẤN ĐỀ

Sự ra đời của Công nghệ thông tin đã đưa nhân loại bước vào một kỷ nguyên mới – kỷ nguyên của kỹ thuật số hay thời kỳ bùng nổ thông tin. Công nghệ thông tin có tầm ảnh hưởng đến hầu hết các mặt của đời sống xã hội, góp phần tạo ra những cuộc cách mạng trong nhiều ngành khoa học. Gần đây, trong lĩnh vực sinh học, việc ứng dụng công nghệ thông tin theo hướng xây dựng những bộ phần mềm dữ liệu để tra cứu, nhận dạng nguồn gen cây trồng phục vụ công tác quản lý, bảo tồn và khai thác tiềm năng của chúng đã được thực hiện. Những kết quả ban đầu hứa hẹn những triển vọng tích cực và khắc phục những nhược điểm mà cho đến nay các phương pháp cũ còn hạn chế.

II. MỘT SỐ THÀNH TỰU BƯỚC ĐẦU VỀ ỨNG DỤNG CÔNG NGHỆ THÔNG TIN TRONG NHẬN BIẾT NGUỒN GEN CÂY TRỒNG

1. Nhận biết nguồn gen cây trồng theo các phương pháp truyền thống

Nhận dạng nguồn gen là vấn đề phức tạp và rất quan trọng đối với công tác nghiên cứu, bảo tồn và khai thác sử dụng tài nguyên di truyền thực vật, là việc làm đầu tiên quyết định cho việc xác định đối tượng bảo tồn và phương hướng bảo tồn tài nguyên di truyền thực vật, là cơ sở của việc xây dựng các tập đoàn cơ bản Nhà nước, đồng thời giúp xác định các loài cây đích để thiết lập các vùng bảo tồn cho các nhóm cây trồng bản địa và họ hàng hoang dại gần gũi với cây trồng. Việc nhận dạng chính các nguồn gen còn là cơ sở khoa học cho việc định hướng sử dụng nguồn vật liệu khởi đầu cho công tác chọn tạo giống. Quá trình này đã từng bước góp phần tích cực đẩy mạnh phát triển sản xuất nông nghiệp và đạt được những tiến bộ quan trọng như ngày nay.

Ngay từ khi biết sử dụng cây cỏ phục vụ cho các mục đích sử dụng khác nhau của mình, con người đã tiến hành sắp xếp chúng theo những trật tự nhất định để có thể nhận dạng chúng dựa trên những đặc điểm hình thái giống và khác nhau. Tuy nhiên, khó khăn lớn nhất là những bất đồng về mặt ngôn ngữ và quan điểm nên đã phát sinh nhiều bất cặp, hoặc xẩy ra tình trạng cùng một cây nhưng cách gọi khác nhau theo từng địa phương. Đến thế kỷ 18, khi nhà khoa học người Thuỵ Điển Carl Linné nêu ra khái niệm về loài và coi loài là đơn vị phân loại cơ bản nhất thì “Phân loại thực vật” mới trở thành một ngành nghiên cứu thực sự để thống nhất những quy định chung về cách nhận dạng thực vật. Phân loại thực vật học (Plant Taxonomy) là cách gọi tên, miêu tả và phân biệt (classifying) các cây cỏ theo hình thái bên ngoài và giải phẫu bên trong. Phân loại thực vật học đã tạo được sự thống nhất cao phục vụ mục đích tra cứu, nhận dạng các loài cây để quản lý và khai thác sử dụng chúng có hiệu quả. Đối với cây trồng, dựa vào các tiêu chí phân loại, các nhà khoa học đã thống kê trên thế giới có khoảng 5.000 loài cây trồng nông nghiệp. Riêng Việt Nam, có khoảng trên dưới 1.000 loài được đề cập và mô tả trong các cuốn Thực vật chí, Danh lục thực vật và một số tài liệu khác.

Tuy nhiên, cho đến nay, việc phân loại thực vật theo phương pháp cổ điển (mô tả hình thái và giải phẫu) cũng chỉ đáp ứng được đến mức độ loài trở lên, các cấp độ dưới loài còn rất hạn chế với số lượng taxon nhất định.

2. Một số kết quả về ứng dụng công nghệ thông tin trong nhận biết nguồn gen thực vật trên thế giới

Ứng dụng công nghệ thông tin vào nghiên cứu sinh học được các nước Nhật Bản, Hàn Quốc, Hoa Kỳ, Nga, … là những nước đi tiên phong, đã hình thành được cơ sở lý luận và phương pháp luận cho một lĩnh vực khoa học mới là “Tin sinh học” (Bio-informatic). Hoạt động chính của nó trước hết là xây dựng phần mềm các bộ dữ liệu về sinh học, giúp cho việc nghiên cứu, bảo tồn và sử dụng nguồn tài nguyên di truyền thực vật có hiệu quả. Theo hướng này, các tổ chức và cơ quan nghiên cứu như: Tổ chức lương thực và nông nghiệp thế giới (FAO), Viện tài nguyên di truyền thực vật thế giới (Bioversity), Viện nghiên cứu lúa quốc tế (IRRI), Trung tâm rau màu châu Á (AVDRC)… đã tiến hành đồng thời việc xây dựng và quản lý các cơ sở dữ liệu tài nguyên di truyền thực vật song song với việc xây dựng các Ngân hàng thực liệu. Kết quả là hàng loạt các cơ sở dữ liệu tài nguyên di truyền thực vật như PROSEA, GRIN, ICIS, CUBIK…. đã được xây dựng và quảng bá trên Internet. Mọi đối tượng có thể truy cập để chia sẻ thông tin hoặc khai thác sử dụng. Một số cơ sở dữ liệu chung liên kết đến nhiều dữ liệu cũng đã được khởi động và đang tiến hành thử nghiệm như cơ sở dữ liệu kết hợp thông tin kiểu gen và kiểu hình của các tập đoàn quỹ gen GERMINATE do Đại học Dundee phối hợp với Viện nghiên cứu cây trồng Xcốtlen và Trung tâm Tài nguyên di truyền Thực vật Hà Lan thực hiện. Những cơ sở dữ liệu này đã đáp ứng được phần nào mục đích tra cứu, nhận dạng nguồn gen cây trồng cho nhiều đối tượng thuộc nhiều quốc gia một cách nhanh chóng và tiện dụng mà chỉ thông qua công nghệ thông tin mới thực hiện được. Tuy nhiên, nó vẫn còn những tồn tại như:

– Các cơ sở dữ liệu của GRIN chủ yếu chỉ đáp ứng được về mặt tra cứu tên taxon với một bảng số liệu hàng chục ngàn tên taxon, nhưng chưa phục vụ được mục đích tra cứu để nhận dạng.

– Một vài chương trình do các nhà khoa học Trung Quốc xây dựng trên nền Web đã bắt đầu hướng vào phục vụ công tác tra cứu, nhận dạng dựa vào các đặc điểm hình thái học theo kiểu khoá lưỡng phân tuy nhiên chỉ mới đáp ứng được đến taxon Họ và một số loài và khó phát triển thành một cơ sở dữ liệu đủ lớn.

– Những ý tưởng trong việc tạo các thiết bị nhận dạng dựa vào việc phân tích hình ba chiều thông qua bộ vi xử lý và mắt điện tử vẫn chưa thành công.

Mặc dù vậy, đây là khởi đầu quan trọng, mở ra triển vọng lớn trong việc ứng dụng công nghệ thông tin để nhận dạng nguồn gen thực vật nói chung, trong đó có nguồn gen cây trồng.

3. Vài nét về ứng dụng công nghệ thông tin trong nhận biết nguồn gen thực vật ở Việt Nam

Ở Việt Nam, việc ứng dụng công nghệ thông tin trong sinh học nói chung và thực vật nói riêng vẫn còn rất mới mẻ. Cho đến nay, có một số kết quả bước đầu được công bố, gồm:

– Thiết lập được cơ sở dữ liệu về protein, phục vụ nghiên cứu và quản lý sinh vật ở mức độ phân tử, thuộc lĩnh vực công nghệ sinh học do trường Đại học Khoa học Tự nhiên, thành phố Hồ Chí Minh thực hiện.

– Xây dựng được phần mềm về “Phân loại sinh vật rừng Việt Nam” do tác giả Phùng Mỹ Trung thực hiện. Công trình đã đọat giải thưởng Trí tuệ Việt Nam năm 2000. Phần mềm này được Sở khoa học công nghệ tỉnh Đồng Nai nâng cấp xây dựng lên phiên bản 2.0 với công cụ tra cứu thông minh (Smart searching) đã được nhận Giải thưởng Sáng tạo Khoa học Công nghệ VIFOTEC. Bộ dữ liệu “Phần mềm sinh vật rừng Việt Nam 2.0” được đánh giá là một kho tàng kiến thức đồ sộ về sinh vật rừng với các phương pháp phân loại mới nhất, thuật ngữ sinh học và khóa định danh loài giúp mọi đối tượng như học sinh, sinh viên và những người muốn nghiên cứu, tìm hiểu về các loài động thực vật rừng ở Việt Nam, thậm chí cả những người có kiến thức hạn hẹp nhất về phân loại cũng có thể tiếp cận. Hạn chế của bộ dữ liệu này ở chỗ: cấu trúc của nó gần với kiểu sách điện tử hơn (gần với cách tra cứu của GRIN hay Eflora), tức là tra cứu theo tên khoa học là chính, không thuộc kiểu cơ sở dữ liệu tra cứu nhận dạng, định danh mẫu vật.

Trong hiện tại, Hệ thống Bảo tồn tài nguyên di truyền thực vật quốc gia đang lưu giữ 20.800 nguồn gen của gần 300 loài cây trồng phục vụ mục tiêu lương thực và nông nghiệp quốc gia bao gồm các loại cây lương thực, thực phẩm, rau, … bản địa và nhập nội. Ngân hàng gen cây trồng quốc gia đang xây dựng bộ dữ liệu điện tử nhưng mới còn giới hạn ở mức độ dữ liệu về hình thái sinh học và dữ liệu về lai lịch cho những đối tượng đã khá rõ ràng. Một trong những khó khăn lớn để xây dựng bộ dữ liệu này là công tác nhận dạng các nguồn gen còn yếu, nhiều nguồn gen chưa được xác định tên khoa học hoặc xác đinh không chính xác (như các tập đoàn cây cải tạo đất, cây thức ăn gia súc, một số nhóm rau, đậu đỗ, …), điều này ảnh hưởng rất lớn đến quá trình nghiên cứu, bảo tồn và khai thác các nguồn gen đó như xác định đối tượng bảo tồn, xây dựng các tập đoàn hạt nhân, tập đoàn cơ bản, …

III. KẾT LUẬN

Xây dựng bộ phần mềm dữ liệu về nguồn gen thực vật là công việc khá phức tạp, đòi hỏi phải có lực lượng đủ mạnh về nguồn nhân lực cũng như trang thiết bị kỹ thuật. Song trong hoàn cảnh hiện nay, Việt Nam đang vừa thiếu vừa yếu về nhưng điều này. Công việc đòi hỏi phải có những chuyên gia có trình độ và kinh nghiệm nhưng trong hệ thống bảo tồn hầu như có rất ít các chuyên gia thực thụ trong lĩnh vực phân loại thực vật. Việc định danh nguồn gen chủ yếu dựa vào tên gọi của cây trồng nên độ tin cậy rất thấp. Vấn đề định dạng trong các tập đoàn quỹ gen của hệ thống bảo tồn nói chung còn bị trùng lặp nhiều, cần được tiến hành bổ sung bằng các biện pháp như chỉ thị phân tử và hóa sinh nhưng về mặt này chúng ta cũng còn rất yếu.

Một số nguyên nhân khách quan khác có tác động lớn đến việc bảo tồn nguồn gen thực vật của chúng ta như nhiều nguồn gen quý hiếm của quốc gia đã bị xói mòn, một số thực vật xâm hại nguy hiểm, hay thực vật trong danh mục cấm lại được nhập nội và triển khai vào sản xuất gây nguy hại đến hệ sinh thái bản địa và đời sống xã hội, đây cũng chính là hậu quả của việc coi nhẹ công tác phân loại thực vật nói chung và nhận dạng nguồn gen nói riêng.

Vấn đề đặt ra là để quản lý tốt nguồn gen thực vật, nhằm khai thác một cách có hiệu quả theo hướng xây dựng nền nông nghiệp hiện đại, đa dạng và bền vững, việc cần làm đầu tiên là phải làm tốt công tác nhận dạng nguồn gen cây trồng. Trong hoàn cảnh hiện nay cho phép chúng ta có thể tiếp thu những thành tựu khoa học công nghệ của thế giới, đặc biệt là công nghệ thông tin với một số phần mềm của các nước đã công bố và được đưa vào thử nghiệm hoặc ứng dụng như Hệ thống tra cứu của GRIN, phần mềm liên kết kiểu gen và kiểu hình của GERMINATE… giúp chúng ta từng bước có thể thiết lập được những chương trình nhận dạng nguồn gen cây trồng trên mày tính phù hợp với điều kiện Việt Nam. Hy vọng trong thời gian không xa, ccùng với sự nỗ lực của các nhà làm công tác nghiên cứu, phân loại, bảo tồn cùng với sự tiến bộ về những ứng dụng của thông tin khoa học công nghệ trong lĩnh vực này, công tác nhận dạng nguồn gen trong hệ thống bảo tồn tài nguyên di truyền thực vật quốc gia sẽ phát huy được những mặt tích cực, khắc phục được những tồn tại hiện nay, góp phần củng cố vững chắc công tác công tác bảo tồn, phục vụ mục tiêu phát triển nền nông nghiệp hiện đại, đa dạng và bền vững của Việt Nam.


TÀI LIỆU THAM KHẢO

1. Võ Văn Chi, Trần Hợp, 1999. Các loài cây có ích ở Việt Nam. Nhà xuất bản Giáo dục Hà Nội.

2. Phạm Hoàng Hộ, 1991-1993. Cây cỏ Việt Nam. Nhà xuất bản Trẻ Hà Nội.

3. www.vncreatures.net. Sinh vật rừng Việt Nam.

4. Võ Văn Chi, 1970-1986. Từ điển cây thuốc Việt Nam. Nhà xuất bản Y học Thành phố Hồ Chí Minh.

5. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Taxonomy. Entrez Taxonomy.

6. Brummitt, 1991. Families and genera of vascular plants. Royal Botanic gardens.

7. http://hua.huh.harvard.edu/china/mss/intindex.htm. Flora of China.

8. Aubreville A. et al., 1960-1997. Flore du Cambodge, Laos et du Vietnam. Muséum national Dhistoire Naturelle.

9. Lecomte M. H.,1908-1923. Flore generale de L’Indo-Chine, Paris.

10. GERMINATE version 1.8.4 – A generic database for integrating genotypic and phenotypic information for plant genetic resource collections. Scottish Crop Research Ins., John Innes Centre And The Centre for Genetic Resources the Netherlands, July 2005.

11. http://www.ars-grin.gov/cgi-bin/npgs/html/taxgenform.pl?language=en. GRIN Taxonomy for Plants. USDA, ARS, National Genetic Resources Program, Germplasm Resources Information Network – (GRIN) [Online Database].National Germplasm Resources Laboratory, Beltsville, Maryland. (08 November 2006).

12. http://www.itis.usda.gov/download_data.html. ITIS DATA ACCESS. Vascular Plant Taxonomy Fourth Edition. Walters D. R. and Davis J. K., 1996.

KSC. Nguyễn Tiến Hưng & cs

Đới Hồng Hạnh

Admin trang web Trung tâm Tài nguyên thực vật phiên bản Wordpress

Trả lời

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *