Výskum, vývoj a aplikácia technológiíInteligentná analýza a modelovanie dát

ExProf

Umožňuje porovnávanie sady dát, ktoré boli získané za odlišných experimentálnych podmienok. Ak niektoré body v dátových súboroch neboli získané, program ich môže dopočítať. Pomocou programu je možné identifikovať štatisticky významné rozdielnosti v analyzovaných dátových vzorkách.

Vstupom do programu sú mnohopočetné dátové súbory numerických dát vo formáte MS EXCEL. Spracované dáta sú exportované do výstupného súboru rovnakého typu.

Na dopĺňanie chýbajúcich dátových bodov je používaný Gaussian Mixture Model (GMM), ktorého parametre sú trénované pomocou Expectation Maximization (EM) algoritmu. Chýbajúce hodnoty je možné doplniť z natrénovanej pravdepodobnostnej distribúcie.

Na štatistickú detekciu odľahlých bodov je možné použiť General Linear Model. GLM aproximuje dátové body lineárnym alebo kvadratickým fitom, a parametre týchto fitov sú potom použité na meranie odlišnosti medzi korešpondujúcimi bodmi z rôznych experimentálnych podmienok.

Príklady použitia

  • zostavenie expresných profilov proteínov z nameraných veľkostí spotov získaných 2D elektroforézou,
  • dopĺňanie chýbajúcich bodov v expresných profiloch,
  • porovnanie expresných profilov získaných za štandardných a pozmenených experimentálnych podmienok,
  • porovnávanie pôvodne nameraných alebo linearizovaných expresných profilov,
  • identifikácia proteínov s rozdielnymi expresnými profilmi buď na základe štatistickej významnosti alebo podľa zvoleného počtu najrozdielnejších profilov,
  • zobrazenie expresných profilov v tabelárnej aj grafickej forme, v tabuľkách sú chýbajúce experimentálne hodnoty doplnené EM algoritmom farebne zvýraznené.

V prípade potreby je možné modifikovať formát a štruktúru vstupných aj výstupných dát podľa požiadaviek zákazníka.

ExProf môže bežať buď lokálne alebo v serverovom móde kde výpočtovo náročné časti algoritmu bežia na serveri.

ExProf bol vyvinutý v spolupráci s Ústavom genetiky a biotechnológie rastlín SAV.

ExProf – obrázky

Produkty

    Bioinformatika a spracovanie dát

    • ADICyt na automatizované klastrovanie dát z prietokovej cytometrie
    • ADprot na automatizované vyhľadávanie dát v proteínových databázach
    • ExProf na zostavovanie a porovnávanie expresných profilov
    • InDelFinder na automatizované vyhľadávanie mutácií v sekvenciách DNA
    • Logit na automatickú detekciu závislostí v dátach pomocou logistickej regresie
    • MultipluginG na pridanie funkcionality k programu Geneious pre potreby NextGen sekvenovania
    • Parent Prophet na zisťovanie príbuzenstva ľubovoľných osôb