Chemometric Methods in Plant Metabolomics
Title: | Chemometric Methods in Plant Metabolomics |
Author(s): | Isomaa, Keijo |
Contributor: | University of Helsinki, Faculty of Science, Department of Chemistry |
Discipline: | Analytical Chemistry |
Language: | English |
Acceptance year: | 2013 |
Abstract: |
This study focuses on chemometric analysis of instrumental data that has been obtained from chemical analysis of plant extracts. Chemometric analysis applies statistical and mathematical tools on chemical data, aiming to find new information or classifying samples in categories defined by the analyst. Chemometric analysis is based on computational pattern recognition and reveals any features that studied samples may have in common.
In the literature part of this study, chemometrics and relevant concepts closely related to it are first explained and four commonly used chemometric methods are introduced, namely principal component analysis, hierarchical cluster analysis, k nearest neighbors and soft independent modeling of class analogy. The text is written with emphasis on being easily understandable without prior knowledge on the subject. After introducing these concepts, the literature concerning metabolomic studies of plant extracts published in the recent ten years are reviewed. This literature commonly employs chemometrics, aiming to discover if two or more varieties of the same plant species have markedly differing metabolomes and whether they can be exploited to automatically recognize these varieties. Additionally, the chemometric approaches often attempt to discover what factors are causing the successful findings. The purpose of the literature survey is to concretely show how chemometrics can achieve these goals, and to learn what the most common ways to treat the analytical data prior to chemometric analysis are.
The experimental part applies chemometric methods to study bean extracts of the Ricinus communis plant, aiming to reveal if seed extracts of a same plant variety can be observed being similar, but clearly different from extracts of other varieties. Such situation could be exploited to develop a method that automatically identifies unknown seeds of the plant. The experimental work consisted of extracting homogenized samples with dilute aqueous acid, analyzing the extracts by three different instrumental techniques (liquid chromatography with ultraviolet light detection, liquid chromatography-mass spectrometry, and proton nuclear magnetic resonance spectroscopy) and finally analyzing the instrumental data by chemometric methods.
Chemometrics research suffers from nonexistent standard operating procedures, since there is no universal way to treat a sample or data derived from it. While the main steps are often same, the details of sample preparation and preprocessing of analytical data vary greatly and can have a significant impact on the outcome. Despite, the data preprocessing is often left partially or completely manifested. The experimental finding was that six varieties of Ricinus communis could be successfully discriminated by both principal component analysis and hierarchical cluster analysis, applied on chromatographic data, while the results for spectroscopic data were not successful. The results encourage continuing the research, but with more emphasis on peak alignment and further experimenting with the preprocessing of the spectroscopic data. Choosing different short segments of the original spectroscopic profile is suggested, to leave out excessive information that is not helpful in discriminating the plant varieties but could obscure the relevant information.
Tämä tutkielma käsittelee kasviuutteista kerätyn mittausdatan analysointia kemometrisilla menetelmillä. Kemometrinen analyysi tarkoittaa tilastollisten ja matemaattisten menetelmien hyödyntämistä kemiallisen mittausdatan tutkimisessa. Kemometrisessä analyysissä pyritään esimerkiksi löytämään analysoiduista näytteistä uutta tietoa tai lajittelemaan näytteitä analyytikon määrittelemiin kategorioihin. Kemometrinen analyysi perustuu tietokoneen tekemään hahmontunnistukseen ja löytää sekä ennalta tunnettuja, että uusia yhteyksiä näytteiden välillä.
Tutkielman kirjallisuusosiossa selitetään aiheeseen liittyvät tärkeät käsitteet ja neljän suositun kemometrisen menetelmän perusperiaatteet (mm. pääkomponenttianalyysi ja hierarkkinen klusterianalyysi). Tekstissä on pyritty siihen, että se olisi helposti ymmärrettävissä ilman esitietoja kemometriasta. Aiheeseen johdattelun jälkeen kirjallisuusosa katselmoi kasviuutteiden kemometrista tutkimusta viimeisen kymmenen vuoden ajalta. Kirjallisuudessa käytetään usein kemometriaa selvittämään, poikkeaako saman kasvilajin useamman eri lajikkeen metabolomit niin merkittävästi toisistaan, että niitä voitaisiin käyttää hyväksi tunnistamattomien lajikkeiden automaattisessa tunnistamisessa, verrattaessa niitä aiemmin analysoituihin tunnettuihin näytteisiin. Kemometrisissä tutkimuksissa pyritään usein myös selvittämään, mitkä tekijät lajikkeiden metabolomeissa mahdollistavat niiden erottamisen toisistaan. Kirjallisuuskatsauksen tarkoituksena on konkreettisesti osoittaa, kuinka kemometrialla päästään tällaisiin tuloksiin ja oppia kuinka mittausdataa on tapana muokata kemometriseen analyysiin paremmin sopivaksi, kun kyse on kasviuutteista.
Tutkielman kokeellinen osa soveltaa kemometrisia menetelmiä risiinikasvin pavuista kerättyjen uutteiden tutkimiseen ja pyrkii selvittämään, voidaanko saman kasvilajikkeen sisäisten uutteiden havaita poikkeavan merkittävästi muiden lajikkeiden uutteista. Tällaisessa tapauksessa on mahdollista kehittää tietokoneen tekemään hahmontunnistukseen perustuva menetelmä, joka automaattisesti tunnistaa mitä lajiketta analysoitu papu edustaa. Kokeellinen työ koostui kuorittujen homogenoitujen papujen uuttamisesta laimealla hapolla, uutteiden analysoimisesta kolmella modernilla mittaustekniikalla (nestekromatografia ultraviolettivalo-detektorilla, nestekromatografia–massaspektrometria ja protonin ydinmagneettiseen resonanssiin perustuva spektroskopia) ja saadun mittausdatan kemometrisesta analyysistä.
Kirjallisuuskatsauksesta selvisi, ettei kemometrisessa tutkimuksessa ole standardeja menettelytapoja, koska ei ole olemassa yhtä kaikkeen soveltuvaa näytteenkäsittelytapaa eikä mittaustapaa. Vaikka pääpiirteet ovat usein samoja, näytteenkäsittelyn ja mittausdatan esikäsittelyn yksityiskohdat vaihtelevat paljon ja niillä voi olla suuri vaikutus tutkimuksen lopputulokseen ja johtopäätöksiin. Tästä huolimatta, datan esikäsittely jätetään usein osittain tai kokonaan kuvailematta. Kokeellisessa työssä havaittiin, että risiinikasvin kuusi tutkittua lajiketta saadaan onnistuneesti erotettua omiksi ryhmikseen sekä pääkomponenttianalyysin, että hierarkkisen klusterianalyysin avulla, kun analyysi tehtiin kromatografiselle mittausdatalle, mutta spektroskopiselle datalle sama ei onnistunut. Tulokset kannustavat jatkamaan tutkimusta, mutta jatkossa suositellaan käytettävän enemmän aikaa datassa esiintyvien piikkien kohdistamiseen. Lisäksi spektroskopisen datan esikäsittelyä tulee kehittää, jotta siinä heikkona esiintyvä biologinen informaatio saadaan kunnolla näkyville. Analyysiin voidaan esimerkiksi valita muita lyhyitä pätkiä kokonaisspektristä, jotta datassa enimmäkseen esiintyvää epäoleellista ja mahdollisesti mielenkiintoisen informaation alleen peittävää informaatiota saadaan vähennettyä.
|
Files in this item
Files | Size | Format | View |
---|---|---|---|
Keijo Isomaa - Master's thesis.pdf | 1.599Mb |
This item appears in the following Collection(s)
-
Faculty of Science [4253]