International Chemical Identifier
Der IUPAC International Chemical Identifier (InChI, ausgesprochen "Intschie"), (englisch: Internationale chemische Bezeichnung der IUPAC) ist ein chemischer Strukturcode, der es ermöglicht, ein Molekül in eine standardisierte Zeichenkette zu übersetzen.[1] Davon abgeleitet ist die Kurzform InChIKey.[2] Mit beiden können dann Datenbanken oder das Internet leichter durchsucht werden.[3]
Der Code wurde im Zeitraum von 2000 bis 2004 von der IUPAC und dem NIST entwickelt und stellt das digitale Pendant der IUPAC-Nomenklatur für jede bestimmte chemische Verbindung dar.[4] Neben der Hauptschicht wird die chemische Struktur durch fünf Schichten von Information definiert – Konnektivität, Tautomerie, Isotopie, Stereochemie und Formalladung.[3]
Der InChI-Algorithmus wandelt eingegebene Strukturinformation in einem dreistufigen Prozess in die Identifikationszeichenfolge – Normalisierung (Entfernung redundanter Information), Kanonisierung (Erstellung eines eindeutigen Satzes von Atomkennungen), Serialisierung (Anordnung der Information in eindeutiger Reihenfolge) um. Die Software und das Format war bis 2020 zwar markenrechtlich geschützt.
Die Referenzimplementierung wurde als freie Software unter der LGPL veröffentlicht.[2] Für Java existiert eine JNI basierte Brücke.[5]
Beispiele



| CH4 Methan |
InChI=1S/CH4/h1H4 |
| CH3CH2OH Ethanol |
InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
![]() L-Ascorbinsäure |
InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |
Schichten
Es gibt sechs InChI-Schichten:
- Hauptschicht
- Ladungsschicht
- Stereochemieschicht
- Isotopschicht
- fixierte-H-Schicht
- „Reconnected Layer“
Sub-Schichten
Jede Schicht kann sich in Sub-Schichten (untergeordnete Schichten) spalten. Beispielsweise kann sich die Hauptschicht in drei Sub-Schichten spalten:
- Chemische Formel (kein Präfix)
- Atomverbindung (Präfix: „c“)
- Wasserstoffatome (Präfix: „h“)
Notation
Schicht und Sub-Schichten sind jeweils durch ein „ / “ voneinander abgegrenzt. Alle Schichten und Sub-Schichten mit Ausnahme der Chemische-Formel-Subschicht der Hauptschicht beginnen mit einem Kleinbuchstaben, der den Informationstyp der Schichten angibt.
Siehe auch
- Wiswesser Line Notation (WLN)
- Chemische Formel
- Konstitutionsformel
- Simplified Molecular Input Line Entry Specification
Literatur
- Ulrich Rößler: Strukturformeln als Text speichern. In: Nachr. Chem. 60, Nr. 2, 2012, S. 140, doi:10.1002/nadc.201290083.
Weblinks
- Offizielle Website (englisch)
- IUPAC InChI auf GitHub (englisch)
- International Chemical Identifier bei SourceForge
Einzelnachweise
- ↑ Eintrag zu International Chemical Identifier. In: IUPAC (Hrsg.): Compendium of Chemical Terminology. The “Gold Book”. doi:10.1351/goldbook.11456.
- ↑ a b IUPAC International Chemical Identifier–InChI Update. In: Chemistry International. Band 31, Nr. 3, 1. Juni 2009, ISSN 1365-2192, S. 21–21, doi:10.1515/ci.2009.31.3.21a.
- ↑ a b Stephen R. Heller, Alan McNaught, Igor Pletnev, Stephen Stein, Dmitrii Tchekhovskoi: InChI, the IUPAC International Chemical Identifier. In: Journal of Cheminformatics. Band 7, Nr. 1, 30. Mai 2015, S. 23, doi:10.1186/s13321-015-0068-4, PMID 26136848, PMC 4486400 (freier Volltext).
- ↑ Ray Boucher, Stephen Heller, Alan McNaught: The Status of the IUPAC InChI Chemical Structure Standard. In: Chemistry International. Band 39, Nr. 3, 26. Juli 2017, ISSN 1365-2192, S. 47–47, doi:10.1515/ci-2017-0316.
- ↑ Ola Spjuth, Arvid Berg, Samuel Adams, Egon L. Willighagen: Applications of the InChI in cheminformatics with the CDK and Bioclipse. In: Journal of Cheminformatics. Band 5, Nr. 1, 13. März 2013, S. 14, doi:10.1186/1758-2946-5-14, PMID 23497723, PMC 3674901 (freier Volltext).
