Macierzowe systemy kodowania konstytucji cząsteczki
Macierzowy system kodowania konstytucji cząsteczki Algebraicznym sposobem kodowania grafów molekularnych jest zapis struktury związku chemicznego w postaci macierzy Numeryczna reprezentacja grafu molekularnego w postaci macierzy zależna jest od sposobu kodowania atomów i łączących je wiązań chemicznych Rozpowszechniony jest zapis w postaci macierzy sąsiedztwa, odległości, incydencji lub wiązań Standardy wymiany infromacji strukturalnej
Grafy cząsteczek chemicznych Struktura 2D cząsteczki paracetamolu Reprezentacja struktury cząsteczki paracetamolu w postaci dwuwymiarowego grafu molekularnego wraz z numeracją atomów Standardy wymiany infromacji strukturalnej
Macierz sąsiedztwa A(G) eij – element macierzy E(G) – zbiór wiązań (krawędzi grafu) Macierz sąsiedztwa A grafu molekularnego G złożonego z n atomów (wierzchołków) to symetryczna macierz kwadratowa A(G) o wymiarach n n Wartość 1 wskazuje na wiązanie (krawędź eij) pomiędzy atomami i i j; w przypadku braku wiązania na danej pozycji występuje wartość 0 Standardy wymiany infromacji strukturalnej
Macierz sąsiedztwa dla cząsteczki paracetamolu Standardy wymiany infromacji strukturalnej
Macierz odległości D(G) dij – najkrótsza geometryczna lub topologiczna miara odległości pomiędzy atomami i i j Macierz odległości D grafu molekularnego G o n atomach to symetryczna macierz kwadratowa D(G) o wymiarach n n Jednostką odległości geometrycznej (3D) jest Å (10-10m), zaś topologicznej najkrótsza ścieżka (liczba wiązań) pomiędzy atomami i i j Standardy wymiany infromacji strukturalnej
Macierz odległości topologicznej dla cząsteczki paracetamolu Standardy wymiany infromacji strukturalnej
Macierz wiązań B(G) bij – numeryczna reprezentacja rodzaju wiązania pomiędzy atomami i i j Macierz wiązań B(G) to symetryczna, kwadratowa tablica o wymiarach n n Wartości bij – 1 koduje wiązanie pojedyncze, 2 podwójne itd. Standardy wymiany infromacji strukturalnej
Macierz wiązań dla cząsteczki paracetamolu Standardy wymiany infromacji strukturalnej
Formaty wymiany informacji strukturalnej Przetwarzanie, przechowywanie i przesyłanie danych wymaga zdefiniowania medium pośredniczącego – pliku MDL Molfile - ogólnie akceptowany format wymiany informacji strukturalnej Inne popularne formaty SDfile (ang. structure data file) (ang. protein data base) CIF (ang. crystalographic interchange format) Standardy wymiany infromacji strukturalnej
Standardy wymiany infromacji strukturalnej Wybrane formaty plików zawierających informacje strukturalne dla cząsteczki paracetamolu Standardy wymiany infromacji strukturalnej