Heute hatte Flare einen Netzwerk-Ausfall. Ich bin dem Team dankbar, dass das notwendige Upgrade im Voraus geplant, bereit, getestet und geprüft wurde. Daher konnte Flare schnell wiederhergestellt werden. Ich schätze die schnelle Arbeit der Validatoren und des Ökosystems, die schnell reagiert und das Upgrade durchgeführt haben.
Netzwerkvorfall Nachbesprechung: Validator-Sampling-Fehler
I. Zusammenfassung
Am 26. Juni 2025 um 2:40 Uhr UTC erlebte das Flare Mainnet einen kurzen Ausfall, der zu einem vorübergehenden Stopp der Blockproduktion führte. Das Problem wurde als ein bekannter und seitdem behobener Fehler im Validator-Sampling-Mechanismus identifiziert, der von einer upstream-Abhängigkeit geerbt wurde. Ein vorgeplanter, geprüfter Netzwerk-Upgrade, der die Lösung enthielt, wurde vorzeitig bereitgestellt und stellte die Netzwerkfunktionalität erfolgreich bis 11:15 Uhr UTC am 26. Juni 2025 wieder her.
II. Ursachenanalyse
Der Ausfall wurde durch einen Fehler in der go-flare v1.10-Client-Software ausgelöst, der von einer upstream Avalanche-Abhängigkeit (avalanchego) stammte. Der Fehler befand sich im Validator-Sampling-Algorithmus, der für die Blockproduktion und die Peer-Auswahl entscheidend ist. Unter bestimmten Netzwerkbedingungen überschritt das kumulierte Gewicht aller Validatoren den maximalen Wert für eine 64-Bit vorzeichenbehaftete Ganzzahl (MaxInt64). Dies führte zu einem errOutOfRange-Fehler, der dazu führte, dass die Validator-Knoten heruntergefahren wurden. Der Verlust dieser Validatoren unterbrach die Fähigkeit des Netzwerks, neue Blöcke zu produzieren.
III. Lösung
Der zugrunde liegende Fehler war bereits in avalanchego v1.11.0 behoben worden, das die Sampling-Logik aktualisierte, um den größeren uint64-Datentyp zu unterstützen. Flare hatte proaktiv seine entsprechende v1.11-Version vor dem ursprünglichen Zeitplan geprüft und vorbereitet. Als Reaktion auf den Vorfall wurde dieses geplante Upgrade als Notfall-Patch bereitgestellt. Die neue Software wurde erfolgreich ausgerollt, wodurch der Fehler behoben und die Netzwerkstabilität sowie die Betriebsabläufe wiederhergestellt wurden.
IV. Nächste Schritte
Die erfolgreiche Bereitstellung dieses Upgrades hat die Resilienz und Stabilität des Netzwerks verbessert und es in die Lage versetzt, zukünftiges Wachstum zu bewältigen. Wir haben unseren Vorfallreaktionsprozess überprüft, um eine schnelle Bereitstellung kritischer Patches sicherzustellen, falls ähnliche Situationen auftreten.
Wir danken unseren Infrastrukturprovidern und der breiteren Gemeinschaft für ihre schnelle Reaktion und Unterstützung, die entscheidend für die zügige Lösung dieses Vorfalls waren.
34.323
695
Der Inhalt dieser Seite wird von Dritten bereitgestellt. Sofern nicht anders angegeben, ist OKX nicht der Autor der zitierten Artikel und erhebt keinen Anspruch auf das Urheberrecht an den Materialien. Der Inhalt wird ausschließlich zu Informationszwecken bereitgestellt und gibt nicht die Ansichten von OKX wieder. Er stellt keine wie auch immer geartete Befürwortung dar und sollte nicht als Anlageberatung oder Aufforderung zum Kauf oder Verkauf digitaler Vermögenswerte betrachtet werden. Soweit generative KI zur Bereitstellung von Zusammenfassungen oder anderen Informationen verwendet wird, können solche KI-generierten Inhalte ungenau oder inkonsistent sein. Bitte lesen Sie den verlinkten Artikel für weitere Details und Informationen. OKX ist nicht verantwortlich für Inhalte, die auf Websites Dritter gehostet werden. Der Besitz digitaler Vermögenswerte, einschließlich Stablecoins und NFTs, ist mit einem hohen Risiko verbunden und kann starken Schwankungen unterliegen. Sie sollten sorgfältig abwägen, ob der Handel mit oder der Besitz von digitalen Vermögenswerten angesichts Ihrer finanziellen Situation für Sie geeignet ist.