Parallele funktionelle Annotation von Krebs - Oceanic Blue Group Co., Ltd

Wissenschaftliche Berichte Band 12, Artikelnummer: 18487 (2022) Diesen Artikel zitieren

784 Zugriffe

3 Altmetrisch

Details zu den Metriken

Der Einsatz der Exomsequenzierung zur Biomarker-Entdeckung und Präzisionsmedizin erfordert die Verbindung von Variationen auf Nukleotidebene mit funktionellen Veränderungen in kodierten Proteinen. Für die funktionelle Annotation der Tausenden von krebsassoziierten Missense-Mutationen oder Varianten unsicherer Signifikanz (VUS) ist die Reinigung unterschiedlicher Proteine für die biochemische und funktionelle Analyse jedoch kostenintensiv und ineffizient. Wir beschreiben die parallele funktionelle Annotation (PFA) einer großen Anzahl von VUS unter Verwendung kleiner Kulturen und Rohextrakte in 96-Well-Platten. Mithilfe von Mitgliedern einer Histon-Methyltransferase-Familie demonstrieren wir die strukturelle und funktionelle Annotation krebsassoziierter Mutationen im Hochdurchsatz. Durch die Kombination der funktionalen Annotation von Paralogs haben wir zwei phylogenetische und Clustering-Parameter entdeckt, die die Genauigkeit sequenzbasierter funktionaler Vorhersagen auf über 90 % verbessern. Unsere Ergebnisse zeigen den Wert von PFA für die Definition onkogener/tumorsuppressiver Funktionen von Histon-Methyltransferasen sowie für die Verbesserung der Genauigkeit sequenzbasierter Algorithmen bei der Vorhersage der Auswirkungen krebsassoziierter Mutationen.

Die funktionelle Annotation krebsassoziierter Mutationen ist eine Herausforderung1,2. Die meisten Missense-Mutationen treten an Positionen ohne bekannte Funktion auf, was die Identifizierung von Fahrer- und neutralen (Beifahrer-)Mutationen verhindert. Aktuelle funktionale Annotationsmethoden nutzen die Konservierung von Nukleotid- und Aminosäuresequenzen (aa), um die Pathogenität von Mutationen vorherzusagen3,4,5. Die Validierung basiert auf der Divergenz der Mutanten in den AA-Seitenketten im Vergleich zum Wildtyp und auf der statistischen Schätzung der Wahrscheinlichkeit einer positiven Selektion im Verhältnis zur Hintergrundmutationsrate6. Die Änderung einer konservierten AA führt jedoch nicht immer zu einer Änderung der Funktion. Algorithmen, die strukturelle und thermodynamische Informationen in funktionelle Vorhersagen einbeziehen7,8, sind durch den Mangel an Strukturinformationen für Proteinkonformations- und Ligandenzustände begrenzt. Für Proteine in Komplexen ist es schwierig, den Einfluss der Aminosäuresubstitution auf die Funktion vorherzusagen. Für gut charakterisierte Proteine verbessern sich die Vorhersagen, aber solche Informationen erfordern eine kostspielige und zeitaufwändige Proteinreinigung und -charakterisierung. Zu wissen, welche Mutationen Krebs auslösen, ist für die Priorisierung zell- und tierbasierter Studien von entscheidender Bedeutung, funktionelle Vorhersageprogramme können diese kostenintensiven Experimente jedoch nicht zuverlässig steuern6,9.

Wir beschreiben parallele funktionelle Annotation (PFA) zur Hochdurchsatzcharakterisierung von krebsassoziierten Missense-Varianten unsicherer Signifikanz (VUS) ohne Proteinreinigung. Wir demonstrieren den Wert von PFA mit drei Histon-H3-Lysin-4 (H3K4)-Methyltransferasen der Mixed Lineage Leukemia (MLL)-Familie, die zu den am häufigsten mutierten Genen bei Krebs gehören (Abb. S1A)10,11,12,13,14,15, 16,17,18,19,20. Mutationen in Enzymen der MLL-Familie sind mit genomweiten Aberrationen in den Mustern der H3K4-Methylierung verbunden, die mit abnormalen Transkriptionsprogrammen verbunden sind, die Malignität fördern18,21,22,23. Von Hunderten von MLL1-3-VUS befinden sich die meisten an Aminosäurepositionen ohne bekannte Funktion (Abb. S1B). Wir untersuchten 99 krebsassoziierte Missense-Mutationen in oder um die katalytischen Suppressor of Variegation-, Enhancer of Zeste- und Trithorax-Domänen (SET) und verglichen die Ergebnisse mit zwei weit verbreiteten funktionellen Vorhersageprogrammen. Mithilfe der funktionalen Annotation von drei MLL-Paralogs haben wir herausgefunden, dass die Kombination von zwei phylogenen und Clustering-Parametern die Genauigkeit der sequenzbasierten funktionalen Vorhersage auf > 90 % verbesserte. Diese Ergebnisse bilden eine Grundlage für die Verbesserung rechnerischer Methoden zur Vorhersage funktioneller Auswirkungen krebsassoziierter Mutationen für die Entdeckung von Biomarkern und die Präzisionsmedizin.

Um besser zu verstehen, wie gut Vorhersagewerkzeuge klinisch relevante Missense-Mutationen in häufig mutierten Enzymfamilien kategorisieren, haben wir VUS in den katalytischen SET-Domänen von MLL1-3 funktionell analysiert (Abb. 1) und die Ergebnisse mit drei weit verbreiteten rechnerischen Vorhersageprogrammen verglichen. MLL-Enzyme katalysieren die Methylierung von Histon H3 Lysin 4 (H3K4)24. Veränderungen sind mit genomweiten Aberrationen in der Methylierung verbunden, die mit Malignität verbunden sind. MLL1-3 gehören zu den am häufigsten mutierten Genen bei mehreren Krebsarten25,26. Von Hunderten von MLL1-3-VUS befinden sich die meisten an Aminosäurepositionen ohne bekannte Funktion (Abb. S1).

Arbeitsablauf für den Parallel Functional Annotation (PFA)-Assay. (1) Rekombinante Expressionsplasmide für Wildtyp (WT) und Mutanten (MT) in Escherichia coli wurden in 5-ml-Kulturen induziert. (2) Kulturpellets wurden lysiert und geklärt. Der Rohextrakt wurde mittels Coomassie-gefärbter SDS-PAGE und/oder Western Blot auf gleiche Mengen an rekombinantem Protein normalisiert. E. coli methyliert keine Histone, daher wurden die Substrate ohne rekombinantes Protein nicht verändert und Lysate dienten in den Tests als Enzymquelle. (3) Tests mit Lysaten in PCR-Röhrchenstreifen wurden mit einer temperaturäquilibrierten Mischung gestartet, die Untereinheiten enthielt, die für aktive Histon-Methyltransferase-Komplexe (WRAD), biotinylierte Histon-H3-Peptide (Aminosäuren 1–20) als Substrat und radioaktiv markiertes S-Adenosylmethionin erforderlich sind ( 3H-SAM). (4) Die Reaktionen wurden auf kommerziell erhältliche, mit Streptavidin/Szintillationsmittel beschichtete 96-Well-FlashPlates34 mit Löschreagenz übertragen (Schritt 4). Die Löschzeiten für Endpunkttests wurden mithilfe des WT-Enzyms bestimmt, um sicherzustellen, dass das Signal-Rausch-Verhältnis im linearen Bereich des Zeitverlaufs liegt. (5) Ein Plattenlesegerät erkannte ein Signal für methylierte biotinylierte Peptide, die von Streptavidin in der Nähe des Szintillationsmittels eingefangen wurden, wodurch die Entfernung von nicht eingebautem 3H-SAM unnötig wurde. (6) Die Ergebnisse wurden analysiert. H3K4me0, unmethyliertes H3; H3K4me1, monomethyliertes H3.

Wir haben aus dem Catalogue of Somatic Mutations In Cancer ( COSMIC)-Datenbank27 und aus der Exomsequenzierung von 308 Tumoren unterschiedlichen Ursprungs an der Mayo Clinic28. Wir haben die funktionellen Auswirkungswerte für jede Mutation mithilfe der krebsspezifischen Option „Functional Analysis Through Hidden Markov Models (v2.3) (FATHMM)“29 berechnet, dem funktionalen Vorhersageserver Polymorphism Phenotyping v2 (PolyPhen-2), der Strukturinformationen in Anmerkungen integriert7 und CancerVars Onkogenpriorisierung durch künstliche Intelligenz (OPAI)-Server30. Unter Verwendung der Standard-Krankheitsschwellenwerte prognostizierte FATHMM vier Mutationen, die zu Krebs führten; 96 % wurden als Passagiermutationen vermutet (Ergänzungsdatei 1). Die PolyPhen-2-Scores deuteten darauf hin, dass 89 Mutationen wahrscheinlich schädlich, 5 möglicherweise schädlich und 1 gutartig waren. Die Programme einigten sich auf 1 gutartige/Passagier- und 4 Krebs/wahrscheinlich schädliche Schlussfolgerungen (5 %), jedoch mit hoher Diskrepanz bei den funktionellen Schlussfolgerungen für die verbleibenden ~ 95 % der Missense-Mutationspositionen (Abb. 2A) – deren wahre Funktionen unbekannt sind . Wir haben CancerVar auch verwendet, um das onkogene Potenzial des 99 VUS (Ergänzungsdatei 1) vorherzusagen, und haben festgestellt, dass die Mehrheit (82 %) eine unsichere Wahrscheinlichkeit für Onkogenität aufweist (OPAI-Score < 0,95). Die Meinungsverschiedenheiten zwischen den Programmen veranlassten uns, einen Hochdurchsatz-Funktionsassay zu entwickeln, um prädiktive Werkzeuge zum Verständnis der Rolle von SET-Domänenmutationen bei Krankheiten zu unterstützen.

Parallele funktionelle Annotation (PFA) von krebsassoziierten Histon-Methyltransferase-Varianten unsicherer Signifikanz (VUS). (A) Venn-Diagramm der funktionellen Vorhersage von FATHMM und PolyPhen-2 von Mixed Lineage Leukemia (MLL) VUS: 5 von 99 Mutationen hatten überlappende Vorhersagen. (B) Oben: Sekundärstrukturkarte der katalytischen SET-Domäne aus PDBsum basierend auf PDB 5F59, Aminosäuren 4754–4911. Dargestellt sind Alpha-Helices (H1-3), Beta-Faltblätter (β1-10), Beta-Haarnadel-Sturns (rot gefärbte Haarnadel-Sturns) und Liganden-/Metallbindungsreste: H3/SAH-Bindung (rot gefülltes Quadrat), SAH-Bindung (blau gefülltes Dreieck). ), Zinkionenbindung (blau gefülltes Quadrat/grün gefülltes Dreieck). Unten, repräsentative PFA von MLL3-VUS-Mutationen durch Szintillationszählung. Das Abschrecken erfolgte nach 30 Minuten, wobei die Daten gegen WT normalisiert wurden. Rosa und violett, Tests gestartet mit H3K4me0, H3K4me1. Gestrichelte Linien und entsprechende schattierte Bereiche, Durchschnitt bzw. Standardabweichung (1σ) für alle Varianten mit Aktivität > 50 % des WT. Fehlerbalken, Standardabweichung aus 2 unabhängigen Experimenten. (C) Repräsentative Ergebnisse der PFA für MLL3-VUS-Mutationen durch Fluorographie von SDS-PAGE. Oberes, mit Coomassie gefärbtes Gel gelöschter enzymatischer Reaktionen; Mitte, Signal von Reaktionen mit H3K4me0- (nicht methylierten) oder H3K4me1- (monomethylierten) Peptiden; unten: Expression von MLL3-Varianten durch Coomassie-gefärbte SDS-PAGE. Die Tests erfolgten wie in Abb. 1 beschrieben, wobei die für die volle enzymatische Aktivität erforderlichen rekombinanten Untereinheiten begrenzt wurden31,32,33, um Aktivitätsschwankungen aufgrund unterschiedlicher MLL-Expression zu minimieren. Die Monomethylierungs- und Dimethylierungsraten wurden unter Verwendung unmodifizierter oder monomethylierter Substrate bestimmt. Die Aktivität hing von der rekombinanten Expression ab (keine Aktivität in der nicht induzierten Kontrolle, UIC, Spur 1). Die Spuren 2–11 zeigen repräsentative Wildtyp- (WT) und Varianten-MLL3-Komplexe und zeigen, dass Aktivitätsschwankungen nicht durch unterschiedliche Expression erklärt werden können. Eine unbeschnittene Version von Abb. 2C ist in Abb. S11 dargestellt.

Um den tatsächlichen funktionellen Einfluss auf die enzymatische Aktivität zu bestimmen, haben wir eine kostengünstige Hochdurchsatz-PFA-Plattform für den schnellen Vergleich der enzymatischen Aktivität in Varianten- und Wildtyp-Proteinen entwickelt. PFA beinhaltet die parallele Expression von Wildtyp- und Variantengenen in kleinen Kulturen (Abb. 1). Wir haben die Charakterisierung aller 99 VUS-Histonmethylierungsenzyme als Modell verwendet, die Wildtyp- oder Varianten-SET-Domänen aus rekombinanten Plasmiden in Escherichia coli exprimieren. Nach der Zelllyse wurden die Tests durch die Kombination roher, normalisierter Extrakte mit 3H-S-Adenosylmethionin (3H-SAM), biotinyliertem Histonpeptidsubstrat und Cofaktoren oder interagierenden Proteinen, in unserem Fall gereinigten rekombinanten Untereinheiten, die für die volle enzymatische Aktivität erforderlich sind, eingeleitet31,32 ,33. Zu bestimmten Zeitpunkten wurden die Reaktionen auf kommerziell erhältliche, mit Streptavidin/Szintillationsmittel beschichtete 96-Well-FlashPlates34 mit Quencher übertragen. Ein Plattenlesegerät erkannte Reaktionssignale, in unserem Fall für methylierte biotinylierte Peptide, die von Streptavidin in der Nähe des Szintillationsmittels eingefangen wurden. Die Daten wurden gegen die Wildtyp-Enzymaktivität normalisiert (Abb. 2B und Abb. S2, S3, S4). Bei allen Schritten wurden 8-Kanal-Pipetten in einem Standard-PCR-Thermocycler verwendet, was eine Parallelisierung mit hohem Durchsatz ermöglichte.

Um die Ergebnisse zu validieren, wurden die Reaktionen durch Fluorographie sichtbar gemacht (Abb. 2C). Die Methylierungsaktivität hing von der rekombinanten Expression ab, ohne Aktivität in der nicht induzierten Kontrolle (Spur 1). Wildtyp- und Varianten-MLL3-Komplexe zeigten, dass die Aktivitätsvariation nicht durch unterschiedliche katalytische Domänenexpression erklärt werden konnte (Spuren 2–11 und unteres Feld). Die Variation der enzymatischen Aktivität durch Fluorographie stimmte qualitativ mit den Ergebnissen der Szintillationszählung überein (Abb. S5). Darüber hinaus stimmten die beobachteten Veränderungen der relativen Aktivität für die Untergruppe zuvor charakterisierter Mutationen mit der Literatur überein12,13,32,33,35,36,37,38,39 und validierten den Test. Von den 99 durch PFA gekennzeichneten VUS zeigten 62 % einen Funktionsverlust (LOF) (Aktivität < 50 % des Wildtyps), 3 % zeigten einen Funktionsgewinn (GOF) und 35 % zeigten keine signifikante Veränderung ( Abb. 3A).

Struktur-Funktions-Annotation von Methyltransferase-Krebs-assoziierten Varianten unsicherer Signifikanz (VUS). (A) Anteile neutraler (Wildtyp-[WT]-ähnlicher), Loss-of-Function- (LOF) und Gain-of-Function-(GOF)-Varianten aus paralleler funktioneller Annotation von 99 Mixed Lineage Leukemia (MLL) VUS. (B) Cluster-Omega-Sequenzausrichtung der SET-Domänen (Active Site-Containing) von drei MLL-Paralogs. Grau, neutral; grün, GOF; rot, LOF; rosa, MLL1-Mutationen, die die Dimethylierung von Histon H3 Lysin 4 (H3K4), aber nicht die Monomethylierung eliminieren. Die Annotation mit der PDBSum-Sekundärstruktur basiert auf MLL1. Cluster 1–5 Balken zeigen mutmaßliche Missense-Mutationscluster. (C) Oberflächendarstellung der MLL1-SET-Domäne (PDB-Code 2W5Z) mit Mutationsclustern, gefärbt wie in B). Cluster-2-LOF-Varianten, die auf die Oberfläche des nichtaktiven Zentrums des SET-I-Lappens abgebildet werden, umfassen Mutationen, die mit dem menschlichen Kabuki-Syndrom assoziiert sind, wenn sie in MLL248,49,50,51,52,53,39,54,55 vorliegen. Mutationen beeinträchtigen den komplexen Aufbau und die enzymatische Aktivität, indem sie eine Oberfläche zerstören, die für die Interaktion mit dem für die Katalyse erforderlichen RBBP5/Ash2L-Heterodimer erforderlich ist39. Cluster 3 umfasst α-Helix 5 bis β-Faltblatt 7 mit dem hochkonservierten „NHS“-Signaturmotiv, das für die SET-Aktivität44,61,62,63,64,64 in allen 6 menschlichen MLLs33 nahe dem Drehpunkt der zweilappigen Struktur mit direkten Kontakten essentiell ist zu S-Adenosylmethionin an der Basis der Coenzym-Bindungstasche. Cluster-4-LOF-Varianten umfassen Reste in den β-Faltblättern 8–10 auf einer zusammenhängenden Oberfläche entlang der Domänenbasis. Mutationen wirken sich auf verborgene Aminosäuren auf der nicht dem Lösungsmittel ausgesetzten Oberfläche der β-Faltblätter 8 und 9 aus (voraussichtlich werden sie destabilisiert). Eine GOF-Variante in MLL3 ersetzte Tyrosin 4884, das an der Position des aktiven Zentrums „Phe/Tyr-Schalter“ eingefügt wird und die Produktspezifität mit Cystein bestimmt32,63,66,67,68,69,70,71,72,72. Diese Variante dimethylierte, wurde jedoch nicht monomethyliert, ähnlich einer krebserregenden Y-zu-C-Substitution im aktiven Zentrum der Polycomb-SET-Domäne EZH271. Cluster 5 umfasst die Post-SET-Domäne mit dem zinkbindenden Lappen (Daumen) der SET-Domäne, wobei 3 von 4 Cysteinen das Zinkatom koordinieren (viertes von Cluster 3). Zink ist entscheidend für den Adenin-proximalen Teil der Coenzym-Bindungstasche. Grauer Text, SET-I- und Post-SET-Lappen (kritisch für die Methyltransferase-Aktivität) und Kabuki-Interaktionsoberfläche; Histon H3 und Ball-and-Stick-Modell, Position des aktiven Zentrums auf dem SET-I-Lappen. (D) Vergrößerte Ansicht von VUS-Mutationsclustern, die im aktiven Zentrum zusammenlaufen, wobei die Positionen des Substrats und des Cofaktorprodukts S-Adenosylhomocystein (SAH) angegeben sind. (E) Positionen von Domänenmerkmalen.

Um strukturelle und biochemische Einblicke in die Varianten zu gewinnen, verwendeten wir das CLUSTAL-Omega-Sequenz-Alignment40 mit Anmerkungen zur AA-Konservierung und Sekundärstruktur sowie die Kartierung auf Röntgenstrukturen isolierter SET-Domänen (Abb. 3B, C, Abb. S2, S3, S4). )41,42,43,44.

Die meisten LOF-Varianten gruppierten sich um fünf primäre Strukturelemente (Abb. 3B): Cluster 1 wurde auf β-Stränge abgebildet, die mit einer dazwischenliegenden Schleife Teil der SAM-Bindungstasche an der „Handfläche“ der SET-Domäne bilden (Abb. 3C). ,D,E). Mutationen hier verändern wahrscheinlich die Packung des β-Faltblatts gegenüber der Domäne und zerstören die SAM-Bindungstasche. Die Positionen der LOF-Varianten des Clusters 1 wiesen in den SET-Domänen und nur in 2 von 3 MLLs unterschiedliche Grade der AA-Konservierung auf (Abb. 3B). Mehrere neutrale Mutationen, einige an hochkonservierten Positionen, zeigten, dass die AA-Konservierung für funktionelle Vorhersagen nicht immer ausreichte.

Cluster 2 umfasste Reste zwischen β-Strängen in einer Region, von der angenommen wird, dass sie die Substratspezifität bestimmt45 (Abb. 3B–E). Mehrere LOF-Mutationen wurden auf gegenüberliegenden Oberflächen der Region kartiert (Abb. S2, S3, S4). LOF-Varianten in der Nähe des aktiven Zentrums störten wahrscheinlich die Histon- oder Cofaktorbindung. Eine kartierte mutmaßliche GOF-Variante zeigte eine erhöhte Dimethylierung ohne Veränderung der Monomethylierungsaktivität. Dieselbe Position wurde in einer anderen MLL mutiert, ohne dass sich die enzymatische Aktivität änderte (Abb. 3B, Abb. S2, S3). Eine andere GOF-Variante erhöhte die Dimethylierung, ohne die Monomethylierung zu verändern, und kartierte sie auf einer Histonpeptid-bindenden Oberfläche (Abb. S3). Die gleiche Position wurde in einer anderen MLL mutiert, ohne dass sich die Aktivität änderte (Abb. 2B, Abb. S4). Einige Cluster-2-LOF-Varianten wurden auf einer Oberfläche mit nichtaktiven Stellen kartiert, wo wir zeigten, dass Mutationen den Aufbau des Kernkomplexes und die enzymatische Aktivität beeinträchtigen (Abb. 3C)39, eine Wechselwirkung, die durch Kryo-EM bestätigt wurde (Abb. S6)55,56,57,57 . Diese Beobachtungen unterstreichen die Bedeutung der Einbeziehung funktioneller Informationen von mehreren Familienmitgliedern, die sich in ihrer Zusammensetzung mit homologen Untereinheiten unterscheiden können33,38.

Cluster 3 enthielt ein hochkonserviertes NHS-Motiv, das für die enzymatische Aktivität essentiell ist33,42,59,60,61,62,62 und das SAM an der Basis der Coenzym-Bindungstasche direkt kontaktiert. Eine hohe Konservierung und vorherige biochemische Informationen waren wahrscheinlich für die korrekten funktionellen Schlussfolgerungen von FATHMM und PolyPhen-2 für NHS-Motivmutationen verantwortlich. Diese Programme unterschieden jedoch nicht zwischen LOF und neutralen Mutationen für die verbleibenden 95 % der Varianten, einschließlich Cluster 1 und der verbleibenden Cluster 3-Varianten, die basierend auf Strukturinformationen an der Bildung der SAM/S-Adenosylhomocystein-Bindungstasche beteiligt sind (Abb. 3D).

Cluster-4-LOF-Varianten umfassten Reste, die auf einer zusammenhängenden Oberfläche entlang der SET-Domänenbasis abgebildet waren. LOF-Mutationen in diesem Cluster betrafen vorwiegend verborgene AA-Positionen und wurden als destabilisierend eingestuft. Eine GOF-Variante befand sich in einem Rest, der an einer Position in das aktive Zentrum eingefügt wird, die die Produktspezifität bestimmt32,33,61,64,65,66,67,68,69,70,70. Diese Variante zeigte einen gemischten Phänotyp mit verlorener Monomethyltransferase-Aktivität, gewann aber an Dimethyltransferase-Aktivität (Abb. 2B), ähnlich einer krebserregenden Substitution71, die ein Ziel der Lymphombehandlung ist72.

Cluster 5 umfasste eine Domäne, die einen zinkbindenden Lappen bildet und drei von vier Cysteinresten bereitstellt, die ein Zink koordinieren, das für einen Teil der Coenzym-bindenden Tasche entscheidend ist (Abb. 3D). LOF-Varianten in dieser Region destabilisieren wahrscheinlich den Zinkbindungslappen und verändern die SAM-Bindung.

Um zu bestimmen, wie gut funktionale Annotationsprogramme biochemische Veränderungen im VUS der MLL-Familie vorhersagen, haben wir die FATHMM-, PolyPhen-2- und CancerVar-Scores gegen die auf den Wildtyp normalisierte Methyltransferase-Aktivität aufgetragen (Abb. 4A – C). Die FATHMM-Scores sind in drei Regionen unterteilt (Abb. 4A). Von 99 Missense-Mutationen hatten 3, die wahr-positive (TP) Vorhersagen darstellten, eine Aktivität von < 50 % des Wildtyps, wobei die FATHMM-Scores den Standard-Krankheitsschwellenwert (≤ − 0,75) erreichten29. Eine weitere Cluster-3-Vorhersage fiel in den falsch-positiven (FP)-Bereich, wobei die Zuordnung dürftig war, da die Aktivität kaum über dem 50-Prozent-Schwellenwert lag. Eine andere Region, die wahr-negative (TN) Vorhersagen darstellt und 45 % der Mutationen enthält, wies eine Aktivität von > 50 % des Wildtyps mit FATHMM-Scores > − 0,75 auf. Die dritte Region, die falsch-negative (FN) Vorhersagen darstellt (48 % der Mutationen), hatte eine Aktivität von < 50 % im Wildtyp und FATHMM-Werte, die darauf hindeuten, dass keine Krankheit vorliegt.

Vergleich der vorhergesagten und In-vitro-Phänotypen für krebsassoziierte Missense-Varianten unsicherer Signifikanz (VUS). (A) FATHMM-Scores im Vergleich zur relativen Aktivität (Mutante [MT]/Wildtyp [WT]) von VUS, farbcodiert durch Cluster. Die Cluster 1, 2, 4 und 5 weisen über und unter 50 % der Wildtyp-Aktivität ungefähr die gleiche Dichte auf (horizontale gepunktete Linie); vertikale gepunktete Linie, FATHMM-Krebs-Standardkrankheitsschwelle ≤ − 0,75 (größere Sicherheit, dass eine Mutation eine Krankheit verursacht); weiße Kreise, 12 neutrale Mutationen, die nicht in die 5 Cluster passten; rote Punkte, Mutationen, die konservierten „NHS“-Mutationen in Cluster 3 entsprechen (Motiv, das für die enzymatische Aktivität essentiell ist). Drei hochkonservierte Cluster-3-Reste wurden korrekterweise als echte Positive (TPs) bezeichnet, aber FATHMM fehlte die Empfindlichkeit, um die verbleibenden Cluster-3-Funktionsverlustvarianten trotz ähnlichen Aktivitätsverlusts zu bezeichnen. (B) PolyPhen-2-Scores im Vergleich zur relativen Aktivität von VUS. Vertikale Linien, PolyPhen-2-Standard-Krankheitsschwellenwerte: > 0,8 „wahrscheinlich schädlich“, 0,2 bis 0,8 „möglicherweise schädlich“, < 0,2 gutartig). (C) CancerVar OPAI-Scores vs. relative Aktivität von VUS. Vertikale Linie, Standardschwellenwert (< 0,95) für Varianten mit ungewisser Wahrscheinlichkeit einer Onkogenität. (D) Violindiagramm der mittleren Aktivitätsunterschiede zwischen VUS mit niedrigen (< 1,5) oder hohen (> 1,5) Parallelcluster-Scores (pClustScore). Die Signifikanz ergab sich aus zweiseitigen ungepaarten t-Tests. Gestrichelte Linie, Median; gepunktete Linien, oberes und unteres Quartil. (E) Varianten-ProxRatioEach-Werte, die die Nähe benachbarter Missense-Mutationen in jedem Protein zeigen, dargestellt als Funktion der Aminosäureposition unter Verwendung der Mixed Lineage Leukemia (MLL) 1-Nummerierung. (F) Die phylogenetische Clustal-Omega-Clusteranalyse menschlicher SET1/MLL-Proteine zeigt drei Kladen, die sich in der Produktspezifität unterscheiden (me1, 2, 3 ist der Methylierungsgrad)33. (G) Vergleich der Familien- vs. Kladen-Erhaltungswerte in falsch-positiven (FP) und richtig-positiven (TP) PolyPhen-2-Aminosäurepositionen. Zweifaktorielle ANOVA verglichen die Mittelwerte innerhalb der Gruppen. ****P < 0,0001; ns, P > 0,05.

Bei der weiteren Clusterklassifizierung hat FATHMM alle 12 neutralen Mutationen, die nicht zu den fünf Clustergruppierungen gehören, korrekt benannt. FATHMM hat die funktionellen Auswirkungen von nur 6 % aller 51 LOF-Mutationen korrekt vorhergesagt, mit FN-Schlussfolgerungen für 94 %. FATHMM hatte gemischte Ergebnisse für Varianten innerhalb der Strukturcluster. Drei hochkonservierte Cluster-3-Reste wurden korrekt als TPs bezeichnet; FATHMM fehlte trotz ähnlichem Aktivitätsverlust die Sensibilität, die verbleibenden LOF-Varianten aufzurufen (Abb. 4A).

PolyPhen-2 gruppierte die 99 Missense-Mutationen überwiegend in zwei Gruppen (Abb. 4B): 95 % hatten Werte > 0,8, was „wahrscheinlich schädlich“ vorhersagte. Mutationen mit einer Aktivität < 50 % des Wildtyps (53,5 % der Gesamtaktivität) stellten TP-Vorhersagen dar. Alle bis auf 4 der verbleibenden (42 % der Gesamtzahl) mit einer Aktivität > 50 % des Wildtyps stellen FP-Vorhersagen dar. PoylPhen-2 berücksichtigte Strukturinformationen in den Vorhersagen7, aber im Gegensatz zu FATHMM mangelte es an Präzision, um FP- und TN-Schlussfolgerungen angemessen zu unterscheiden.

CancerVar gruppierte die Missense-Mutation in 4 Regionen (Abb. 4C): 53 % hatten OPAI-Werte ≥ 0,95 und wurden als onkogen eingestuft. Mutationen mit einer Aktivität < 50 % des Wildtyps stellten TP- (33 %) und FN-Vorhersagen (19 %) dar, während Mutationen mit einer Aktivität > 50 % des Wildtyps FP- (18 %) und TN-Vorhersagen (29 %) darstellten.

Obwohl die Programme eine allgemeine Übereinstimmung für die wenigen Mutationen in Aminosäurepositionen mit früheren funktionellen Informationen zeigen, hatten sie Schwierigkeiten, die Auswirkungen der verbleibenden Mutationen korrekt zu klassifizieren – trotz der Einbeziehung struktureller Informationen in die Vorhersage. Diese Ergebnisse unterstreichen den Bedarf an zusätzlichen biochemischen Annotationsmethoden mit hohem Durchsatz, um die Variablen zu identifizieren, die für genaue Funktionsvorhersagen am wichtigsten sind.

Die widersprüchlichen Ergebnisse von FATHMM, PolyPhen-2 und CancerVar unterstreichen die Schwierigkeiten, die funktionellen Auswirkungen von VUS mithilfe von Vorhersageprogrammen abzuleiten, die hauptsächlich auf der Erhaltung der Aminosäuresequenz basieren. Um die wichtigsten Variablen zur Vorhersage der funktionellen Auswirkung auf MLL-Enzyme zu identifizieren, enthält die Ergänzungsdatei 2 14 mögliche erklärende Parameter, darunter Änderungen der physikalisch-chemischen Eigenschaften von aa: Anzahl der Seitenkettenatome (ΔAtome) oder Wasserstoffbrückendonoren oder -akzeptoren, Ladung, Hydrophobie, Seitenkettenvolumen und die vorhergesagten Änderungen der sich entfaltenden freien Energie (ΔΔG) bei Punktmutation. Die Substitutionswahrscheinlichkeiten stammen aus der BLOSUM62-Matrix73.

Wir haben die Einbeziehung zusätzlicher Variablen getestet, die aus funktionalen Annotationsbeobachtungen abgeleitet wurden, um die Vorhersagen zu verbessern. LOF-Mutationen häuften sich nicht zufällig in bestimmten Strukturregionen, was darauf hindeutet, dass die Häufung auf eine veränderte Funktion hinweisen könnte. Wir haben einen „Parallel-Cluster-Score“ für Missense-Mutationen (pClustScore) aus der Nähe benachbarter Missense-Mutationen innerhalb jedes Proteins (ProxScoreEach) und der Nähe des Aggregats aller Missense-Mutationen von Mitgliedern der MLL-Familie, projiziert auf eine einzelne AA-Sequenz (ProxRatioAll), berechnet ). Die durchschnittliche enzymatische Aktivität war bei Missense-Mutationen mit hohen vs. niedrigen Cluster-Scores signifikant niedriger (P = 0,0001) (Abb. 4D). Missense-Mutationen gruppiert in 4 Gruppen entsprechend der Strukturanalyse; Die fünfte Gruppe (Post-SET-Domäne) zeigte eine gewisse Clusterbildung (Abb. 4E, Abb. S7). Unterschiede in der Verteilung von Missense-Mutationen unter Familienmitgliedern ließen darauf schließen, dass eine Untergruppe von Missense-Mutationen unterschiedliche Auswirkungen auf jedes Protein hatte.

Um die Gründe für die große Anzahl von PolyPhen-2-FP-Schlussfolgerungen zu verstehen, untersuchten wir Unterschiede in den AA-Erhaltungswerten und verglichen die Alignments aller SET-Domänen der SET1-Familie mit Mitgliedern jeder phylogenetischen Unterfamilie (Klade). Der Vergleich der sechs menschlichen Mitglieder der SET1/MLL-Familie zeigte drei Kladen, die sich in der Zielgen- und Produktspezifität (Anzahl der H3K4-Methylierungen) unterschieden (Abb. 4F)33. PolyPhen-2 TP-Vorhersagen zeigten kaum Unterschiede in den durchschnittlichen Erhaltungswerten für Familien und Kladen. FP-Vorhersagen hatten deutlich niedrigere Familienerhaltungswerte als Kladenerhaltungswerte (P < 0,0001) (Abb. 4G), was darauf hinweist, dass Positionen, die sich zwischen Paralogen unterschieden, trotz hoher Erhaltung bei Orthologen die vorhergesagte Bedeutung verringert hatten. Um zu testen, ob die Einbeziehung phylogenetischer Informationen die funktionellen Vorhersagen verbessert, haben wir Mutation Assessor74 verwendet, um funktionelle Auswirkungsscores (FI-Score) für jede Missense-Mutation zu berechnen. Der FI-Score wird aus einem kombinatorischen Entropieansatz abgeleitet, der gleichzeitig einen „Familienerhaltungs“-Score (VC-Score) und einen „Spezifitätsscore“ (VS-Score) basierend auf der Erhaltung unter Orthologen innerhalb jeder Unterklasse berechnet74,75.

Clustering-Parameter (ProxRatioEach, ProxRatioAll, pClustScore) und phylogenetische Parameter (FI-, VC- und VS-Scores) zeigten jeweils statistisch signifikante Beziehungen mit der Mutantenaktivität im Vergleich zum Wildtyp, Aktivität (Mut/WT) (Spearman's P \(\ le\) 0,01). Die Parameter ΔAtoms, ΔΔG und BLOSUM62 zeigten schwache, aber signifikante Assoziationen mit der Aktivität (Mut/WT) (Spearman's P = 0,04); Andere physikalisch-chemische Parameter korrelierten nicht signifikant (Abb. S8). Die Beiträge der Variablen zur Aktivität (Mut/WT) wurden durch Hauptkomponentenregression anhand von 14 Parametern bestimmt. In Übereinstimmung mit Korrelationen, phylogenetischen Parametern und Clustering-Parametern sowie BLOSUM62 trugen ΔΔG und ΔAtome maßgeblich zur Variation der Methylierungsraten bei (Abb. S9). Unter ausschließlicher Verwendung dieser Kovariaten wurden drei Hauptkomponenten identifiziert, die zusammen etwa 76 % der Variation ausmachten (R2 = 0,61, P < 0,0001 bei Regression auf Aktivität (Mut/WT), Abb. S10). Phylogenetische Parameter machten den größten Anteil der beobachteten Datenvariation aus (37 %); Clustering-Parameter trugen am stärksten zu PC2 (27 %) und ΔAtoms zu PC3 (12 %) bei. PC1- und PC2-Scores zeigten Gruppierungen, die zwischen niedriger und hoher enzymatischer Aktivität entlang PC1 getrennt waren (Abb. 5A), was darauf hindeutet, dass phylogenetische Parameter und Clustering-Parameter die Methylierungsraten am besten vorhersagen. Der FI-Score war stark mit dem VC-Score und dem VS-Score (Spearman-P < 0,0001) assoziiert und war der phylogenetische Parameter für weitere Analysen. Aufgrund der starken Assoziation zwischen pClustScore und ProxRatioAll sowie ProxRatioEach (Spearmans P <0,0001) stellte pClustScore Clustering-Parameter dar (Abb. S8).

Phylogenetische und Clustering-Parameter sagen funktionelle Auswirkungen krebsassoziierter Missense-Varianten unsicherer Signifikanz (VUS) voraus. (A) Hauptkomponenten-Biplot (PC) signifikanter phylogenetischer (FI-Score, VC-Score und VS-Score), Clustering- (pClustScore, ProxRatioAll, ProxRatioEach) und physikalisch-chemischer (ΔAtoms, Blosum62, ΔΔG) Parameter. Rot, VUS mit enzymatischer Aktivität ≤ 50 % des Wildtyps (WT); blau, VUS mit Aktivität > 50 % des WT. Mut, Mutant. (B) Rekursiver Partitionierungsklassifizierungsbaum für enzymatische Aktivität unter Verwendung der Parameter FI-Score, pClustScore, ΔAtoms, Blosum62 und ΔΔG für MLL1-3 VUS. Kreise, interne Knoten, die in Unterknoten unterteilt werden können; Boxen, Endknoten; rot, VUS mit Aktivität ≤ 50 % des WT; blau, VUS mit Aktivität > 50 % des WT. Kreise, P-Werte-Eingabeknoten; Boxplots der Aktivitätswerte (MT/WT) befinden sich in Endknoten. (Anpassungsgüte R2 = 0,65, RMSE = 0,22) (C) Verwirrungsmatrix, die die Vorhersagegenauigkeit des Baums basierend auf dem zehnfachen Kreuzvalidierungsschema zeigt. Der rekursive Partitionierungsalgorithmus wurde mit 10 Anpassungsrunden wiederholt85, wobei jede zufällig ausgewählte Datenteilmengen verwendete, mit 90 % Trainingssatz und 10 % Testsatz. DG) Tatsächliche vs. vorhergesagte Diagramme. X-Achsen, tatsächliche Aktivität; Y-Achsen, vorhergesagte Aktivität basierend auf dem Regressionsmodell. Rote diagonale Linie, Identitätslinie; gestrichelte Linien, Grenzwert für VUS mit weniger als oder mehr als 50 % WT-Aktivität. (D) FI-Score- und pClustScore-Parameter als Prädiktoren. (E) FATHMM-Inferenzwert als Prädiktor. (F) PolyPhen-2-Inferenzwert als Prädiktor. (G) CancerVar Oncogenic Prioritization by Artificial Intelligence (OPAI)-Score als Prädiktor. Dargestellt sind angepasste R2-Werte.

Ein Regressionsbaum unter Verwendung eines unvoreingenommenen rekursiven Partitionierungsalgorithmus76 zeigte, wie phylogenetische, Clustering- und physikalische Parameter die Methylierungsvariabilität zwischen Missense-Mutationen beeinflussten. Der erste Haltepunkt zur Unterscheidung von Varianten mit hoher und niedriger Aktivität basierte auf dem FI-Score, einem Maß für Konservierung und phylogenetische Unterschiede zwischen Paralogs (Abb. 5B). Fast alle VUS-Varianten mit FI-Scores > 3,005 wurden korrekt als LOF mit sehr geringer Aktivität (P < 0,001) klassifiziert. Für VUS-Varianten mit FI-Scores ≤ 3,005 wurde der pClustScore zum Hauptfaktor zur Unterscheidung von Varianten mit hoher und niedriger Aktivität. Die Parameter Blosum62, ΔAtoms und ΔΔG waren nicht signifikant. Somit war die Kombination von FI-Score und pClustScore deutlich besser bei der Vorhersage der funktionellen Auswirkungen von VUS-Mutationen (R2 = 0,63) als FATHMM (R2 = 0,0002), PolyPhen-2 (R2 = 0,05) oder CancerVar (R2 = 0,001) (Abb. 5D–G).

Um die Vorhersagekraft dieser beiden Parameter zu testen, haben wir den rekursiven Partitionierungsalgorithmus mit zehnfacher Kreuzvalidierung77 wiederholt. FI-Score und pClustScore haben die funktionellen Auswirkungen von ~ 92 % der VUS-Varianten korrekt vorhergesagt (Abb. 5C, Tabelle S1) (im Vergleich zu 51 % FATHMM, 55 % PolyPhen-2, 62 % CancerVar, Tabelle S2). Somit wurden die Vorhersagen der funktionellen Auswirkungen erheblich verbessert, indem aa-Erhaltungsinformationen zu allen verwandten Proteinen plus die Erhaltung von Schlüsselpositionen unter Orthologen, die einzigartige Funktionen von Paralogen unterscheiden, mit der Clusterdichte von Missense-Mutationen kombiniert wurden, die funktionelle Bereiche von Proteinfalten definieren.

Wir beschreiben die schnelle, wirtschaftliche PFA-Methode zur funktionellen Annotation von VUS ohne Enzymreinigung, modelliert unter Verwendung von Histon-modifizierenden Enzymen. Das Sammeln funktioneller Informationen zu 99 Mutationen erforderte ein bis zwei Wochen Laborarbeit. Die Ergebnisse für eine Untergruppe von Missense-Mutationen ähnelten früheren Charakterisierungen und bestätigten die PFA. Im Gegensatz zu Vorhersagealgorithmen haben wir herausgefunden, dass 62 % der VUS-Mutationen zu einem Verlust der Histon-Methyltransferase-Aktivität führen, während 35 % keine erkennbaren Defekte aufwiesen, was darauf hindeutet, dass es sich um Passagiermutationen handelt oder dass sie eine Aktivität stören, die im Test nicht vorhanden ist. Von den VUS-Mutationen führten 3 % zu einem beobachtbaren Funktionsgewinn oder -wechsel, darunter eine mit Veränderungen in der Produktspezifität, die denen ähnelten, die in einer SET-Domäne von EZH2 beobachtet wurden, auf die derzeit Therapeutika als Lymphombehandlung abzielen71,72 ,78,79,80. Darüber hinaus haben wir neue LOF- und GOF-Varianten an nicht charakterisierten AA-Positionen identifiziert.

PFA ist am nützlichsten für das parallele Screening einer großen Anzahl von Missense-Mutationen auf veränderte Enzymfunktionen. PFA lässt sich leicht modifizieren, um Mutationen in nichtenzymatischen Untereinheiten zu screenen, sofern diese für die enzymatische Aktivität erforderlich sind, um vorläufige kinetische Parameter (z. B. Vmax) abzuschätzen und nach Varianten zu screenen, die gegenüber hemmenden oder verstärkenden Verbindungen empfindlich sind. Andere gekoppelte fluoreszenzbasierte Tests, die die Bildung von S-Adenosyl-Homocystein34 messen, erfordern gereinigtes Enzym, um Methylierung außerhalb des Ziels oder Fluoreszenzlöschung zu reduzieren. PFA verwendet Rohextrakte, biotinylierte Substrate und FlashPlates, wodurch Schritte zur Proteinreinigung und Entfernung von nicht eingebautem 3H-SAM vor der Messung entfallen. PFA kann für andere Histon-modifizierende Enzyme verwendet werden, wenn es in E. coli funktionell exprimiert wird.

Zu den Nachteilen gehört das Fehlen posttranslationaler Modifikationen, sofern diese für die Aktivität erforderlich sind. Der Assay übersieht wahrscheinlich Mutationen, die die enzymatische Aktivität nicht verändern, aber die GOF-Wechselwirkungen mit Proteinen oder Nukleinsäuren beeinflussen, die im Assay fehlen. Dennoch lieferte PFA Einblicke in sequenzbasierte rechnerische Vorhersagen und schlug Mechanismen für VUS-Beiträge zu Krebs vor.

Durch die Kombination der funktionalen Annotation von drei Paralogen entdeckten wir sequenzbasierte phylogenetische und Clustering-Parameter, die die funktionalen Vorhersagen im Vergleich zu drei rechnerischen Vorhersageprogrammen dramatisch verbesserten. Wir stellten fest, dass die meisten Polyphen-2-FP-Mutationspositionen bei Orthologen konserviert waren, nicht jedoch bei Paralogen. Computerprogramme, die diese phylogenetischen Unterschiede ignorieren, verringern wahrscheinlich die Bedeutung von AA-Positionen, die innerhalb einer phylogenetischen Unterklasse hoch konserviert sind, sich jedoch zwischen Unterklassen unterscheiden, die hinsichtlich bestimmter Funktionen divergierten. Unsere Beobachtung, dass die sechs Mitglieder der menschlichen SET1/MLL-Familie in drei phylogenetische Unterklassen fallen, die sich in der Produktspezifität unterscheiden (Abb. 4E)33, könnte erklären, warum die Programme FATHMM, PolyPhen-2 und CancerVar Schwierigkeiten hatten, die funktionellen Auswirkungen von MLL VUS vorherzusagen (Tabelle S2). ).

Die Bedeutung phylogenetischer Informationen für die Funktionsvorhersage wurde in einem kombinatorischen Entropieansatz mit Mutation Assessor74,75 erkannt, der einen Missense-Mutations-FI-Score basierend auf der Gesamterhaltung einer AA-Position und der Erhaltung von „Spezifitätsresten“, die sich zwischen Paralogs unterscheiden, liefert74. Für PFA erklärte der FI-Score den größten Anteil der Variation der Methylierungsraten bei MLL-Mutationen (36 %, Abb. S10), eine signifikante Verbesserung gegenüber physikalisch-chemischen und BLOSUM62-Parametern zusammen, die < 10 % der Methylierungsratenvariation erklärte. Der FI-Score war notwendig, aber nicht ausreichend für die besten funktionalen Vorhersagen.

Durch die Missense-Mutations-Proximity-Analyse wurden potenzielle Treibergene anhand der Clusterbildung in funktionellen Domänen identifiziert, was auf eine positive Selektion hindeutet. Mehrere Ansätze verwenden sequenzbasierte oder strukturbasierte Ansätze, um Missense-Mutationscluster in Onkogenen quantitativ zu identifizieren81,82,83. Angesichts des Mangels an Strukturinformationen für die meisten Proteine sind sequenzbasierte Parameter wünschenswert. Sequenzbasierte Clustering-Algorithmen konzentrieren sich hauptsächlich auf die Identifizierung potenzieller Onkogene, können aber auch für die Identifizierung struktureller Merkmale nützlich sein, die für die Funktion erforderlich sind. Wir fanden heraus, dass sich die meisten LOF-Mutationen um mindestens vier einzigartige Strukturelemente gruppierten, die an der Substrat- oder Cofaktorbindung oder dem komplexen Aufbau beteiligt sind. Wir haben Unterschiede in den Clustermustern zwischen Paralogs festgestellt, die möglicherweise Unterschiede in den Inaktivierungsmechanismen widerspiegeln. Basierend auf der Mutation Assessor-Analogie haben wir einen VUS-Clustering-Score berechnet, der diese Unterschiede berücksichtigt. Der pClustScore-Parameter konnte Methylierungsraten besser vorhersagen als die Parameter ProxRatioAll und/oder ProxRatioEach (Tabelle S3), was Komplementarität zeigt.

Durch die Kombination von FI-Score und pClustScore wurden ~ 70 % der Variabilität der Methylierungsrate beschrieben, ohne Beiträge von physikalisch-chemischen Parametern, die häufig in Vorhersagealgorithmen verwendet werden. Dieses Maß an Variabilität reichte aus, um funktionelle Auswirkungen von VUS mit einer Genauigkeit von bis zu ~ 90 % vorherzusagen. Diese Ergebnisse legen nahe, dass phylogenetische und Clustering-Parameter aus der parallelen Analyse von Familienmitgliedern wichtige Einschränkungen für die genaue Modellierung der funktionellen Auswirkungen von VUS-Mutationen darstellten, insbesondere für Familien mit mehreren Paralogs.

Diese Arbeit zeigt, wie zunehmendes Wissen über die Auswirkungen von Missense-Mutationen auf die Proteinstruktur und -biochemie die gesamten funktionellen Anmerkungen verbessert. Die Anwendung ähnlicher Hochdurchsatzmethoden mit anderen Proteinen wird dazu beitragen, alle Parameter zu identifizieren, die für genaue, breit anwendbare, sequenzbasierte funktionelle Vorhersagen von Missense-Mutationen im Zusammenhang mit Krankheiten erforderlich sind.

Als Templates wurden pGST-Expressionsplasmide verwendet, die die C-terminalen 260 Aminosäuren jedes Mitglieds der Wildtyp-MLL-Familie kodieren33. Konstrukte der MLL-Familie bestanden aus den Resten MLL1 (3745–3969) (KMT2A, UniprotKB ID Q03164); MLL2 (auch bekannt als MLL4) (5319–5537) (KMT2B(D), (UniprotKB ID O14686); und MLL3 (4689–4911) (KMT2C, UniprotKB ID Q8NEZ4). Die ortsspezifische Mutagenese wurde mit dem QuickChange II XL-Kit durchgeführt ( Agilent). Die firmeninterne Sanger-Sequenzierung wurde verwendet, um das Vorhandensein der beabsichtigten Sequenzvariante und das Fehlen unbeabsichtigter Mutationen zu bestätigen.

Kolonien aus transformierten E. coli-Zellen (Rosetta II (DE3) pLysS, Novagen) wurden verwendet, um 5 ml TBII-Medium mit 50 µg/ml Carbenicillin und 25 µg/ml Chloramphenicol zu beimpfen, und die Kulturen wurden über Nacht unter Schütteln bei 30 °C gezüchtet. Für PFA wurden 0,1 ml Übernachtkultur zu 5 ml frischem TBII mit 50 µg/ml Carbenicillin und 25 µg/ml Chloramphenicol gegeben und bei 37 °C unter Schütteln mit 200 U/min bis zu einer OD600 ~ 1,0 gezüchtet. Die Kulturen wurden 30 Minuten lang auf Eis gekühlt, mit 1 mM IPTG induziert und 24 Stunden lang bei 16 °C und 200 U/min geschüttelt. Die Zellen wurden durch Zentrifugation bei 4.000 U/min bei 4 °C geerntet und die Pellets wurden in Lysepuffer (50 mM Tris pH 7,5, 1 mM TCEP, 300 mM NaCl, 1 µM ZnCl2), ergänzt mit einer EDTA-freien Tablette ohne vollständigen Proteaseinhibitor (Roche), resuspendiert Applied Science), 1XBugBuster (Novagen) und 0,25 mg/ml DNase A. Resuspendierte Pellets wurden 3 Stunden lang bei 4 °C unter sanfter Rotation inkubiert. Zelllysate wurden durch Zentrifugation bei 20.000 U/min und 4 °C geerntet. Der Überstand wurde gesammelt und die Pellets wurden verworfen. Die Lysate wurden aliquotiert, schockgefroren und bei –80 °C gelagert. Das Expressionsniveau jeder Mutante wurde durch 4–15 % SDS-PAGE unter Verwendung von Mini-PROTEAN TGX-Gelen (Bio-Rad) und Coomassie-Färbung bestimmt. Für die Bildgebung und Densitometrie wurde ein Bio-Rad Chemidoc Imager verwendet. Die Expression und Reinigung der MLL-Kernkomplexuntereinheiten WDR5, RbBP5, Ash2L und DPY-30 erfolgte wie zuvor beschrieben33.

Unmodifizierte und H3K4-monomethylierte Histon-H3-Peptide (Reste 1–20), markiert mit GGK-Biotin und C-terminaler Amidierung, wurden von GenScript synthetisiert und auf eine Reinheit von > 95 % gereinigt. Für Methyltransferase-Assays wurde ein gleiches Volumen Wildtyp- oder mutiertes Lysat mit 3 µM WRAD, 250 µM H3-Peptid (unmodifiziert oder monomethyliert) und 1–2 µCi [3H]-SAM (PerkinElmer Life Sciences) in Assay-Puffer inkubiert ( 20 mM Tris pH 8,5, 1 mM TCEP, 200 mM NaCl, 1 µM ZnCl2). Die Proben wurden 30 Minuten lang bei 15 °C inkubiert. Als Negativkontrollen dienten Lysate von mit leerem Vektor (pGST II) oder nichtinduzierten Wildtyp-Plasmiden transformierten Zellen. Die Reaktionen wurden mit 0,5 M EDTA (1:1, v:v) gestoppt. Abgeschreckte Reaktionen wurden unter Verwendung von Testpuffer mit 0,5 M EDTA und 0,2 mg/ml BSA auf 200 µl gebracht und auf mit Streptavidin beschichtete FlashPlate-Mikrotiterplatten mit 96 Vertiefungen (PerkinElmer) übertragen. Die Proben wurden über Nacht bei 4 °C inkubiert, um die Bindung des biotinylierten H3-Peptids an die mit Streptavidin beschichtete Oberfläche vor der Szintillationszählung in einem Hidex Sense Plus-Mikroplattenlesegerät (LabLogic) zu ermöglichen. Für die gelbasierten Fluorographie-Assays wurden die Reaktionen mit SDS-Ladepuffer gequencht und durch 4–12 % BisTris SDS-PAGE (LifeTechnologies) bei 200 V 30 Minuten lang getrennt. Die Gele wurden mit Coomassie gefärbt, abgebildet und dann 30 Minuten lang bei Raumtemperatur in eine Verstärkungslösung (Enlightening, PerkinElmer Life Sciences) gegeben. Die Gele wurden 2,5 Stunden lang bei 72 °C unter konstantem Vakuum getrocknet und vor der Entwicklung 6–72 Stunden lang bei –80 °C einem Film (Eastman Kodak Co. Biomax MS Film) ausgesetzt. Zur Quantifizierung der H3-Peptidmethylierung wurde Densitometrie mit der Software ChemiDoc ImageLab (BioRad) verwendet.

pClustScore wurde aus der Summe zweier Proximity-Parameter abgeleitet, die mithilfe einer Modifikation des Ansatzes von Tamborero et al.81 berechnet wurden. Die Näherungsparameter für Missense-Mutationen wurden berechnet, indem die Anzahl der Missense-Mutationen in einem Fenster +/– 7 aa um jede Mutation herum gezählt und dann durch den Abstand zur nächsten Missense-Mutation dividiert wurde. Das Fenster für Mutationen wurde auf der Grundlage einer Analyse ausgewählt, die zeigt, dass 25 % aller benachbarten Mutationen in der Datenbank „Catalog of Somatic Mutations in Cancer“ (COSMIC) innerhalb von 7 AA voneinander liegen, was dem ersten Quartil der Entfernungen zum nächsten Nachbarn entspricht83. ProxRatioEach wurde basierend auf der Nähe von Missense-Mutationen innerhalb jedes Proteins berechnet und ProxRatioAll wurde für die kombinierten Mutationen für alle drei Familienmitglieder berechnet, die auf eine einzelne Sequenz projiziert wurden. ProxRatioAll und ProxRatioEach wurden korreliert (Abb. S8), was darauf hinweist, dass sie komplementäre Maße für die Mutationsnähe liefern. Wir haben daher die beiden Werte summiert, um den einzelnen Clustering-Parameter pClustScore abzuleiten. Die multiple Regressionsanalyse zeigte, dass pClustScore bei der Vorhersage der H3K4-Methylierungsraten genauer war als jeder Parameter allein oder wenn beide Parameter ohne Summierung verwendet wurden (Tabelle S3).

Die Hauptkomponenten-Regressionsanalyse wurde mit GraphPad Prism Version 9.3.0 für MacOS (GraphPad Software, San Diego, Kalifornien, USA) durchgeführt. Die Komponentenauswahl basierte auf den Hauptkomponenten mit den größten Eigenwerten, die zusammen mindestens 75 % der Gesamtvarianz erklärten. Die rekursive Partitionierungsbaumregression wurde mithilfe der R-basierten Webimplementierung des R-Pakets wie beschrieben76,84 durchgeführt. Die Modellvalidierung wurde mithilfe einer zehnfachen Kreuzvalidierung mit Quantilkategorisierung76 durchgeführt, wobei 90 % der Daten als Trainingssatz und 10 % zum Testen des Modells verwendet wurden. Die Validierung wurde zehnmal mit einem anderen zufällig ausgewählten Trainings- und Testsatz wiederholt.

Die während der aktuellen Studie generierten und/oder analysierten Daten sind in diesem veröffentlichten Artikel (und seinen ergänzenden Informationsdateien) enthalten.

Buniello, A. et al. Der NHGRI-EBI GWAS-Katalog veröffentlichter genomweiter Assoziationsstudien, gezielter Arrays und zusammenfassender Statistiken 2019. Nucleic Acids Res. 47, D1005–D1012 (2019).

Artikel CAS PubMed Google Scholar

Greenman, C. et al. Muster somatischer Mutationen im menschlichen Krebsgenom. Natur 446, 153–158 (2007).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Shihab, HA et al. Ein integrativer Ansatz zur Vorhersage der funktionellen Auswirkungen nichtkodierender und kodierender Sequenzvariationen. Bioinformatik 31, 1536–1543 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Kircher, M. et al. Ein allgemeiner Rahmen zur Abschätzung der relativen Pathogenität menschlicher genetischer Varianten. Nat. Genet. 46, 310–315 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Ritchie, GR, Dunham, I., Zeggini, E. & Flicek, P. Funktionale Annotation nichtkodierender Sequenzvarianten. Nat. Methoden 11, 294–296 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Itan, Y. & Casanova, JL Können die Auswirkungen menschlicher genetischer Variationen vorhergesagt werden? Proz. Natl. Acad. Wissenschaft. USA 112, 11426–11427 (2015).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Adzhubei, IA et al. Eine Methode und ein Server zur Vorhersage schädlicher Missense-Mutationen. Nat. Methoden 7, 248–249 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Kamburov, A. et al. Umfassende Bewertung der Häufung von Krebs-Missense-Mutationen in Proteinstrukturen. Proz. Natl. Acad. Wissenschaft. USA 112, E5486-5495 (2015).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Martelotto, LG et al. Benchmarking von Algorithmen zur Vorhersage von Mutationseffekten unter Verwendung funktionell validierter krebsbedingter Missense-Mutationen. Genom. Biol. 15, 484 (2014).

Artikel Google Scholar

Pugh, TJ et al. Die Sequenzierung des Medulloblastom-Exoms deckt subtypspezifische somatische Mutationen auf. Natur 488, 106–110 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jones, DT et al. Analyse der genomischen Komplexität, die dem Medulloblastom zugrunde liegt. Natur 488, 100–105 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Kudithipudi, S. & Jeltsch, A. Rolle somatischer Krebsmutationen in menschlichen Protein-Lysin-Methyltransferasen. Biochim. Biophys. Acta 1846, 366–379 (2014).

CAS PubMed Google Scholar

Weirich, S., Kudithipudi, S. & Jeltsch, A. Somatische Krebsmutationen in der MLL1-Histon-Methyltransferase modulieren deren enzymatische Aktivität und Abhängigkeit vom WDR5/RBBP5/ASH2L-Komplex. Mol. Oncol. 11, 373–387 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Rong, G. et al. DNA-Schadensreaktion als prognostischer Indikator bei metastasiertem Brustkrebs mittels Mutationsanalyse. Ann. Übers. Med. 9, 220 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Chang, YC et al. Durch gezielte Next-Generation-Sequenzierung wurden neue Mutationen in dreifach negativen myeloproliferativen Neoplasien identifiziert. Med. Oncol. 34, 83 (2017).

Artikel PubMed Google Scholar

Dai, W. et al. Die Sequenzierung des gesamten Exoms deckt kritische Gene auf, die der Metastasierung bei Plattenepithelkarzinomen der Speiseröhre zugrunde liegen. J. Pathol. 242, 500–510 (2017).

Artikel CAS PubMed Google Scholar

D'Afonseca, V. et al. Identifizierung veränderter Gene bei Gallenblasenkrebs als potenzielle Treibermutationen für diagnostische und prognostische Zwecke: Ein rechnerischer Ansatz. Krebs informieren. 19, 1176935120922154 (2020).

Artikel PubMed PubMed Central Google Scholar

Chen, C. et al. MLL3 ist ein haploinsuffizienter 7q-Tumorsuppressor bei akuter myeloischer Leukämie. Krebszelle 25, 652–665 (2014).

Artikel PubMed PubMed Central Google Scholar

Lohr, JG et al. Entdeckung und Priorisierung somatischer Mutationen im diffusen großzelligen B-Zell-Lymphom (DLBCL) durch Sequenzierung des gesamten Exoms. Proz. Natl. Acad. Wissenschaft. USA 109, 3879–3884 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Rao, RC & Dou, Y. Bei Krebs entführt: Die KMT2 (MLL)-Familie der Methyltransferasen. Nat. Rev. Cancer 15, 334–346 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Wu, HT et al. Durch Luteolin induziertes MLL3 verursacht Apoptose in Tamoxifen-resistenten Brustkrebszellen durch H3K4-Monomethylierung und Unterdrückung des PI3K/AKT/mTOR-Signalwegs. Bin. J. Chin. Med. 48, 1221–1241 (2020).

Artikel CAS PubMed Google Scholar

Rampias, T. et al. Die Lysin-spezifische Methyltransferase KMT2C/MLL3 reguliert DNA-Reparaturkomponenten bei Krebs. EMBO Rep. 20(3), e46821 (2019).

Artikel PubMed PubMed Central Google Scholar

Wong, SH et al. Das H3K4-Methyl-Epigenom reguliert das onkogene Potenzial von Leukämie-Stammzellen. Krebszelle 28, 198–209 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Shilatifard, A. Die COMPASS-Familie der Histon-H3K4-Methylasen: Regulationsmechanismen in der Entwicklung und Krankheitspathogenese. Annu. Rev. Biochem. 81, 65–95 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Gao, J. et al. Integrative Analyse komplexer Krebsgenomik und klinischer Profile mit dem cBioPortal. Wissenschaft. Signal. https://doi.org/10.1126/scisignal.2004088 (2013).

Artikel PubMed PubMed Central Google Scholar

Muntean, AG & Hess, JL Die Pathogenese der Leukämie gemischter Abstammung. Annu. Rev. Pathol. 7, 283–301 (2012).

Artikel CAS PubMed Google Scholar

Tate, JG et al. KOSMISCH: Der Katalog somatischer Mutationen bei Krebs. Nukleinsäuren Res. 47, D941–D947 (2019).

Artikel CAS PubMed Google Scholar

Egan, JB et al. (2017) Molekulare Modellierung und Funktionsanalyse von durch Exomsequenzierung abgeleiteten Varianten unbekannter Bedeutung identifizieren eine neue, konstitutiv aktive FGFR2-Mutante beim Cholangiokarzinom. JCO Precis Oncol https://doi.org/10.1200/PO.17.000182017.

Shihab, HA, Gough, J., Cooper, DN, Day, IN & Gaunt, TR Vorhersage der funktionellen Folgen krebsbedingter Aminosäuresubstitutionen. Bioinformatik 29, 1504–1510 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Li, Q. et al. CancerVar: Eine auf künstlicher Intelligenz basierende Plattform zur klinischen Interpretation somatischer Mutationen bei Krebs. Wissenschaft. Adv. 8, eabj1624 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Dou, Y. et al. Regulierung der MLL1-H3K4-Methyltransferase-Aktivität durch ihre Kernkomponenten. Nat. Struktur. Mol. Biol. 13, 713–719 (2006).

Artikel CAS PubMed Google Scholar

Patel, A., Dharmarajan, V., Vought, VE & Cosgrove, MS Über den Mechanismus der mehrfachen Lysinmethylierung durch den Kernkomplex des menschlichen Mixed-Lineage-Leukämie-Protein-1 (MLL1). J. Biol. Chem. 284, 24242–24256 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Shinsky, SA, Monteith, KE, Viggiano, S. & Cosgrove, MS Biochemische Rekonstitution und phylogenetischer Vergleich menschlicher Kernkomplexe der SET1-Familie, die an der Histonmethylierung beteiligt sind. J. Biol. Chem. 290, 6361–6375 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Quinn, AM & Simeonov, A. Methoden zur Aktivitätsanalyse der Proteine, die die Histonmethylierung regulieren. Curr. Chem. Genom. 5, 95–105 (2011).

Artikel CAS Google Scholar

Patel, A., Vought, VE, Dharmarajan, V. & Cosgrove, MS Ein konserviertes Arginin enthaltendes Motiv, das für den Aufbau und die enzymatische Aktivität des Mixed-Lineage-Leukämie-Protein-1-Kernkomplexes entscheidend ist. J. Biol. Chem. 283, 32162–32175 (2008).

Artikel CAS PubMed Google Scholar

Patel, A., Vought, VE, Dharmarajan, V. & Cosgrove, MS Eine neuartige Nicht-SET-Domänen-Methyltransferase mit mehreren Untereinheiten, die für die sequentielle nukleosomale Histon-H3-Methylierung durch den Mixed-Lineage-Leukämie-Protein-1 (MLL1)-Kernkomplex erforderlich ist. J. Biol. Chem. 286, 3359–3369 (2011).

Artikel CAS PubMed Google Scholar

Patel, A. et al. Automethylierungsaktivitäten innerhalb des Mixed-Lineage-Leukämie-1 (MLL1)-Kernkomplexes liefern Hinweise, die ein „Zwei-aktives-Stellen“-Modell für die Methylierung mehrerer Histon-H3-Lysin-4 unterstützen. J. Biol. Chem. https://doi.org/10.1074/jbc.M113.501064 (2013).

Artikel PubMed PubMed Central Google Scholar

Shinsky, SA & Cosgrove, MS Einzigartige Rolle der WD-40-Repeat-Protein-5-Untereinheit (WDR5) innerhalb des Mixed-Lineage-Leukämie-3-Histon-Methyltransferase-Komplexes (MLL3). J. Biol. Chem. 290, 25819–25833 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Shinsky, SA et al. Eine nicht aktive SET-Domänenoberfläche, die für die Interaktion von MLL1 und dem RbBP5/Ash2L-Heterodimer innerhalb der Kernkomplexe der MLL-Familie entscheidend ist. J. Mol. Biol. 426, 2283–2299 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Sievers, F. & Higgins, DG Clustal Omega, genaues Alignment einer sehr großen Anzahl von Sequenzen. Methoden Mol. Biol. 1079, 105–116 (2014).

Artikel CAS PubMed Google Scholar

Laskowski, RA PDBsum neue Dinge. Nukleinsäuren Res. 37, D355-359 (2009).

Artikel CAS PubMed Google Scholar

Southall, SM, Wong, PS, Odho, Z., Roe, SM & Wilson, JR Strukturelle Grundlage für die Notwendigkeit zusätzlicher Faktoren für die MLL1-SET-Domänenaktivität und die Erkennung epigenetischer Markierungen. Mol. Zelle 33, 181–191 (2009).

Artikel CAS PubMed Google Scholar

Zhang, Y. et al. Sich entwickelnde katalytische Eigenschaften der SET-Domäne der MLL-Familie. Struktur 23, 1921–1933 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Li, Y. et al. Strukturelle Grundlage für die Aktivitätsregulation von Methyltransferasen der MLL-Familie. Natur 530, 447–452 (2016).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Xiao, B., Wilson, JR & Gamblin, SJ SET-Domänen und Histonmethylierung. Curr. Meinung. Struktur. Biol. 13, 699–705 (2003).

Artikel CAS PubMed Google Scholar

Banka, S. et al. MLL2-Mosaikmutationen und intragene Deletionsduplikationen bei Patienten mit Kabuki-Syndrom. Klin. Genet. 83, 467–471 (2013).

Artikel CAS PubMed Google Scholar

Banka, S. et al. Wie genetisch heterogen ist das Kabuki-Syndrom? MLL2-Testung bei 116 Patienten, Überprüfung und Analyse der Mutation und des phänotypischen Spektrums. EUR. J. Hum. Genet. 20, 381–388 (2012).

Artikel CAS PubMed Google Scholar

Cocciadiferro, D. et al. Analyse von KMT2D-Missense-Mutationen bei Patienten mit Kabuki-Syndrom. Summen. Mol. Genet. 27, 3651–3668 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Hannibal, MC et al. Spektrum der MLL2 (ALR)-Mutationen in 110 Fällen des Kabuki-Syndroms. Bin. J. Med. Genet. A 155A, 1511–1516 (2011).

Artikel PubMed Google Scholar

Kokitsu-Nakata, NM et al. Analyse des MLL2-Gens in der ersten brasilianischen Familie mit Kabuki-Syndrom. Bin. J. Med. Genet. A 158A, 2003–2008 (2012).

Artikel PubMed Google Scholar

Li, Y. et al. Ein Mutationsscreening bei Patienten mit Kabuki-Syndrom. Summen. Genet. 130, 715–724 (2011).

Artikel CAS PubMed Google Scholar

Ng, SB et al. Exomsequenzierung identifiziert MLL2-Mutationen als Ursache des Kabuki-Syndroms. Nat. Genet. 42, 790–793 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Paulussen, AD et al. MLL2-Mutationsspektrum bei 45 Patienten mit Kabuki-Syndrom. Summen. Mutat. 32, E2018-2025 (2011).

Artikel CAS PubMed Google Scholar

Worden, EJ, Zhang, X. & Wolberger, C. Strukturelle Grundlage für die COMPASS-Erkennung eines H2B-ubiquitinierten Nukleosoms. Elife 9, e53199 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Xue, H. et al. Strukturelle Grundlagen der Nukleosomenerkennung und -modifikation durch MLL-Methyltransferasen. Natur 573, 445–449 (2019).

Artikel ADS CAS PubMed Google Scholar

Park, SH et al. Kryo-EM-Struktur des an das Nukleosom gebundenen menschlichen MLL1-Kernkomplexes. Nat. Komm. 10, 5540 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Qu, Q. et al. Struktur und Konformationsdynamik eines COMPASS-Histon-H3K4-Methyltransferase-Komplexes. Zelle 174 (1117–1126), e1112 (2018).

Google Scholar

Rea, S. et al. Regulierung der Chromatinstruktur durch ortsspezifische Histon-H3-Methyltransferasen. Natur 406, 593–599 (2000).

Artikel ADS CAS PubMed Google Scholar

Trievel, RC, Beach, BM, Dirk, LM, Houtz, RL & Hurley, JH Struktur und katalytischer Mechanismus einer SET-Domänenprotein-Methyltransferase. Zelle 111, 91–103 (2002).

Artikel CAS PubMed Google Scholar

Wilson, JR et al. Kristallstruktur und Funktionsanalyse der Histon-Methyltransferase SET7/9. Zelle 111, 105–115 (2002).

Artikel CAS PubMed Google Scholar

Zhang, X. et al. Struktur des Neurospora-SET-Domänenproteins DIM-5, einer Histon-H3-Lysin-Methyltransferase. Zelle 111, 117–127 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Dillon, SC, Zhang, X., Trievel, RC & Cheng, X. Die SET-Domänen-Protein-Superfamilie: Protein-Lysin-Methyltransferasen. Genom. Biol. 6, 227 (2005).

Artikel Google Scholar

Zhang, X. et al. Strukturelle Grundlage für die Produktspezifität von Histon-Lysin-Methyltransferasen. Mol. Zelle 12, 177–185 (2003).

Artikel PubMed PubMed Central Google Scholar

Collins, RE et al. In-vitro- und In-vivo-Analysen eines Phe/Tyr-Schalters, der die Produktspezifität von Histon-Lysin-Methyltransferasen steuert. J. Biol. Chem. 280, 5563–5570 (2005).

Artikel CAS PubMed Google Scholar

Couture, JF, Dirk, LM, Brunzelle, JS, Houtz, RL & Trievel, RC Strukturelle Ursprünge für die Produktspezifität von SET-Domänen-Protein-Methyltransferasen. Proz. Natl. Acad. Wissenschaft. USA 105, 20659–20664 (2008).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Zhang, X. & Bruice, TC Enzymatischer Mechanismus und Produktspezifität von SET-Domänen-Protein-Lysin-Methyltransferasen. Proz. Natl. Acad. Wissenschaft. USA 105, 5728–5732 (2008).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Qian, C. et al. Strukturelle Einblicke in die Spezifität und Katalyse einer viralen Histon-H3-Lysin-27-Methyltransferase. J. Mol. Biol. 359, 86–96 (2006).

Artikel CAS PubMed Google Scholar

Trievel, RC, Flynn, EM, Houtz, RL & Hurley, JH Mechanismus der mehrfachen Lysinmethylierung durch das SET-Domänenenzym Rubisco LSMT. Nat. Struktur. Biol. 10, 545–552 (2003).

Artikel CAS PubMed Google Scholar

Xiao, B. et al. Spezifität und Mechanismus der Histon-Methyltransferase Pr-Set7. Genes Dev. 19, 1444–1454 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Xiao, B. et al. Struktur und katalytischer Mechanismus der menschlichen Histonmethyltransferase SET7/9. Natur 421, 652–656 (2003).

Artikel ADS CAS PubMed Google Scholar

Wigle, TJ et al. Die Y641C-Mutation von EZH2 verändert die Substratspezifität für die Methylierungszustände von Histon H3-Lysin 27. FEBS Lett. 585, 3011–3014 (2011).

Artikel CAS PubMed Google Scholar

Morin, RD, Arthur, SE & Assouline, S. Die Behandlung von Lymphomen ist jetzt ein bisschen EZ-er. Blutadv. 5, 2256–2263 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Henikoff, S. & Henikoff, JG Aminosäuresubstitutionsmatrizen aus Proteinblöcken. Proz. Natl. Acad. Wissenschaft. USA 89, 10915–10919 (1992).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Reva, B., Antipin, Y. & Sander, C. Vorhersage der funktionellen Auswirkungen von Proteinmutationen: Anwendung auf die Krebsgenomik. Nukleinsäuren Res. 39, e118 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Reva, B., Antipin, Y. & Sander, C. Determinanten der Proteinfunktion durch kombinatorische Entropieoptimierung aufgedeckt. Genom. Biol. 8, R232 (2007).

Artikel Google Scholar

Wessa, P. Rekursive Partitionierung (Regressionsbäume) (v1.0.5) in kostenloser Statistiksoftware (v1.2.1). Büro für Forschungsentwicklung und Bildung. http://www.wessa.net/rwasp_regression_trees.wasp/ Zugriff am 12. Dezember 2021 (2016).

Vihinen, M. Wie lässt sich die Leistung von Vorhersagemethoden bewerten? Maßnahmen und ihre Interpretation in der Variationseffektanalyse. BMC-Genom. 13 (Ergänzung 4), S2 (2012).

Artikel Google Scholar

Morin, RD et al. Somatische Mutationen, die EZH2 (Tyr641) in follikulären und diffusen großzelligen B-Zell-Lymphomen mit Ursprung im Keimzentrum verändern. Nat. Genet. 42, 181–185 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Swalm, BM et al. Reaktionskopplung zwischen Wildtyp und krankheitsassoziiertem Mutanten EZH2. ACS Chem. Biol. 9, 2459–2464 (2014).

Artikel CAS PubMed Google Scholar

Yap, DB et al. Somatische Mutationen bei EZH2 Y641 wirken dominant durch einen Mechanismus der selektiv veränderten katalytischen Aktivität von PRC2, um die H3K27-Trimethylierung zu erhöhen. Blut 117, 2451–2459 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Tamborero, D., Gonzalez-Perez, A. & Lopez-Bigas, N. OncodriveCLUST: Ausnutzung der Positionsclusterung somatischer Mutationen zur Identifizierung von Krebsgenen. Bioinformatik 29, 2238–2244 (2013).

Artikel CAS PubMed Google Scholar

Porta-Pardo, E. & Godzik, A. e-Driver: Eine neuartige Methode zur Identifizierung von Proteinregionen, die Krebs auslösen. Bioinformatik 30, 3109–3114 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Dees, ND et al. MuSiC: Identifizierung der Bedeutung von Mutationen in Krebsgenomen. Genom. Res. 22, 1589–1598 (2012).

Artikel CAS Google Scholar

Everitt, BS & Hothorn, T. A Handbook of Statistical Analyses Using R 2. Aufl. (CRC Press, 2009).

MATH Google Scholar

Kohavi, R. Eine Studie über Kreuzvalidierung und Bootstrap zur Genauigkeitsschätzung und Modellauswahl. Proz. Int. Jt. Konf. Artif. Intel. 2, 1137–1143 (1995).

Google Scholar

Referenzen herunterladen

Wir danken Steve Hanes, Bruce Knutson und Jimmy Hougland für die hilfreiche Diskussion. Wir danken Anne Smardon und Michael Connelly für die kritische Lektüre des Manuskripts und Chris Tachibana für die Bearbeitung. Diese Arbeit wurde vom NIH R01 CA140522 und vom Carol M. Baldwin Breast Cancer Research Fund des CNY an MSC finanziert

Abteilung für Biochemie und Molekularbiologie, State University of New York (SUNY) Upstate Medical University, 4261 Weiskotten Hall, Syracuse, NY, 13210, USA

Ashley J. Canning, Susan Viggiano und Michael S. Cosgrove

Schulze Center for Novel Therapeutics, Abteilung für Onkologieforschung, Mayo Clinic, Rochester, MN, USA

Martin E. Fernandez-Zapico

Sie können diesen Autor auch in PubMed Google Scholar suchen

AJC und MSC führten eine Datenanalyse durch und verfassten das Manuskript. SV sammelte Daten und MSC und MFZ konzipierten die Studie. Alle Autoren haben mit redaktionellen Überarbeitungen beigetragen.

Korrespondenz mit Michael S. Cosgrove.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Canning, AJ, Viggiano, S., Fernandez-Zapico, ME et al. Parallele funktionelle Annotation krebsassoziierter Missense-Mutationen in Histon-Methyltransferasen. Sci Rep 12, 18487 (2022). https://doi.org/10.1038/s41598-022-23229-2

Zitat herunterladen

Eingegangen: 10. Juni 2022

Angenommen: 27. Oktober 2022

Veröffentlicht: 02. November 2022

DOI: https://doi.org/10.1038/s41598-022-23229-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.