Kluczowa różnica między podobieństwem a identycznością w dopasowaniu sekwencji polega na tym, że podobieństwo to podobieństwo (podobieństwo) między dwiema sekwencjami w porównaniu, podczas gdy identyczność to liczba znaków, które dokładnie pasują między dwiema różnymi sekwencjami.
Bioinformatyka to interdyscyplinarna dziedzina nauki, która obejmuje głównie biologię molekularną i genetykę, informatykę, matematykę i statystykę. Dopasowanie sekwencji jest głównym terminem w bioinformatyce. Jest to procedura, w której sekwencje DNA, RNA lub białka są ułożone w celu zidentyfikowania regionów podobieństwa, które jest konsekwencją funkcjonalnego, strukturalnego lub ewolucyjnego związku między sekwencjami. Na końcu wyrównania zostaną one przedstawione jako wiersze w macierzy. Aby wyrównać identyczne znaki w kolejnych kolumnach, między resztami występują wstawione przerwy.
Co to jest podobieństwo?
Podobieństwo w dopasowaniu sekwencji to podobieństwo między dwiema sekwencjami w porównaniu. Fakt ten zależy od identyczności sekwencji. Podobieństwo przedstawia stopień, w jakim pozostałości są wyrównane. Stąd podobne sekwencje mają podobne właściwości. W bioinformatyce podobieństwo jest narzędziem do oceny podobieństwa między dwoma białkami.
Rysunek 01: Podobieństwo w dopasowaniu sekwencji
Istnieją dwa główne etapy procesu dopasowywania sekwencji. Pierwszym krokiem jest dopasowanie parami, które pomaga znaleźć optymalne dopasowanie między dwiema sekwencjami (w tym przerwami) przy użyciu algorytmów takich jak BLAST, FastA i LALIGN. Algorytm dopasowujący znajduje minimalną liczbę operacji edycji; in-dels i substytucje w celu dopasowania jednej sekwencji do drugiej sekwencji. Po wyrównaniu parami konieczne jest uzyskanie dwóch parametrów ilościowych z każdego porównania parami. Są tożsamością i podobieństwem.
Co to jest tożsamość?
Tożsamość w dopasowaniu sekwencji to liczba znaków, które dokładnie pasują do dwóch różnych sekwencji. Dlatego luki nie liczą się przy ocenie tożsamości. Uważa się, że pomiar jest powiązany z krótszą sekwencją między dwiema sekwencjami. Znacząco implikuje to, że ma wpływ, gdy identyczność sekwencji nie jest przechodnia. Jeśli X=Y i Y=Z, to X niekoniecznie jest równe Z. Jest to wyliczane na podstawie miary odległości tożsamości.
Rysunek 02: Tożsamość w dopasowaniu sekwencji
Na przykład, X ma sekwencję AAGGCTT, Y ma sekwencję AAGGC, a Z ma sekwencję AAGGCAT. Tożsamość między X i Y wynosi 100% {5 identycznych nukleotydów/min[długość(X), długość(Y)]}. Tożsamość między Y i Z również wynosi 100%. Ale identyczność między X i Z wynosi tylko 85% {(6 identycznych nukleotydów / 7)}.
Jakie są podobieństwa między podobieństwem a tożsamością w dopasowaniu sekwencji?
- Zarówno podobieństwo, jak i tożsamość to dwa terminy, których używamy do dopasowania sekwencji.
- Odnoszą się również do podobieństwa między tymi dwiema sekwencjami.
- Ponadto wyrażamy je jako wartość procentową.
Jaka jest różnica między podobieństwem a tożsamością w dopasowaniu sekwencji?
Podobieństwo w dopasowaniu mówi o podobieństwie między dwiema sekwencjami w porównaniu, podczas gdy identyczność w dopasowaniu sekwencji mówi o liczbie znaków, które dokładnie pasują między dwiema różnymi sekwencjami. Dlatego jest to kluczowa różnica między podobieństwem a identycznością w dopasowaniu sekwencji.
Podsumowanie – podobieństwo a tożsamość w dopasowaniu sekwencji
Dopasowanie sekwencji pomaga zidentyfikować regiony podobieństwa w DNA, RNA lub białku wynikające z funkcjonalnego, strukturalnego lub ewolucyjnego związku między sekwencjami. Stąd podobieństwo i identyczność to dwa kluczowe terminy w kontekście dopasowania sekwencji. Kluczowa różnica między tymi dwoma terminami polega na tym, że podobieństwo jest podobieństwem między dwiema sekwencjami w porównaniu, podczas gdy identyczność to liczba znaków, które dokładnie pasują między dwiema różnymi sekwencjami. Jest to zatem podsumowanie różnicy między podobieństwem a identycznością w dopasowaniu sekwencji.