18.03.2024

Wie bringt ein beschleunigter Algorithmus verlorene Töne zurück?

Rossen Nenov, Dissertant am ISF im Fachbereich Mathematik, berichtet über ein Verfahren, wie man verloren gegangenen Klang in der Musik wieder rekonstruieren kann. Unlängst hat er zusammen mit weiteren Autoren seine Ergebnisse in der Fachzeitschrift IEEE Transactions on Signal Processing publiziert.

Die Abbildung oben zeigt ein Audiosignal in der üblichen Zeit-Darstellung, darunter dargestellt ist das dazugehörige Spektrogramm. Im vorgestellten Verfahren erreichen wir die Rekonstruktion eines Audiosignals in seine Zeit-Darstellung aus dem Spektrogramm © ISF/ÖAW.

Stellen Sie sich vor, Sie hören Ihre Lieblingsmusik, aber plötzlich fehlen bestimmte Töne oder die Klarheit der Stimmen verschwimmt. In der digitalen Welt ist das keine Seltenheit. Digitale Signale verlieren auf ihrem Weg oder bei Messungen oft wichtige Informationen. Ein spezielles Problem in diesem Kontext ist der Verlust der Phase eines Signals, was so viel bedeutet wie der Verlust des "Herzschlags" der Töne. Dies kann die Qualität von Audiodateien erheblich beeinträchtigen. Doch was, wenn es eine Möglichkeit gäbe, diese verlorenen Informationen wiederherzustellen?

Rossen Nenovs Forschung setzt genau hier an: Die Entwicklung eines Verfahrens, das die verlorene Phase eines Audiosignals basierend auf den Magnituden des Spektrogramm wiederherzustellen versucht. Aus mathematischer Sicht ist ein Spektrogramm die Darstellung einer Zeit-Frequenz-Transformation des Signals. Es besteht aus den Magnituden und den Phasen der Transformations Koeffizienten und wenn man alle kennt, dann kann man das Signal problemlos wiederherstellen. Aber sobald etwas fehlt, wird das zu einem schwierigen Problem. Insbesondere wenn ein großer Teil der Phasen fehlen, kann es sogar nicht mehr möglich sein, das Signal perfekt zu rekonstruieren, da man weniger Information hat, als man benötigt. Daher wurden bisher eine Vielzahl an Verfahren entwickelt, die alle zum Ziel haben, eine noch genauere und bessere Wiederherstellung des Audiosignals zu erreichen als bisherige Verfahren.

Unser Algorithmus “Accelerated Griffin-Lim Algorithm” oder auf Deutsch “Beschleunigtes Griffin-Lim Verfahren” ist eine Weiterentwicklung eines bereits bekannten Verfahrens, in dem wir zusätzliche Beschleunigungsschritte eingebaut haben. Millisekunden sind hier wichtig, denn in unserer digitalen Welt ist man oft zeitlich beschränkt, zum Beispiel bei der Übertragung von Live-Streams oder bei Telefonaten, und man möchte in möglichst kurzer Zeit eine möglichst gute Rekonstruktion haben.

Des Weiteren haben wir für diesen Algorithmus einen sogenannten Konvergenzbeweis, einen mathematischen Nachweis der Zuverlässigkeit, aufgestellt. Er zeigt, dass das Verfahren tatsächlich nicht nur zu einem sinnvollen Ergebnis führt, sondern auch, dass er numerisch stabil ist. Vor allem bei beschleunigten Algorithmen ist diese Stabilität von entscheidender Bedeutung, denn sie können dazu tendieren, schnell und “übereifrig” zu einem Ergebnis zu kommen und können ohne entsprechende Absicherung leicht von ihrem Pfad abkommen.

Nenov, Rossen; Nguyen, Dang-Khoa.; Balazs, Peter; Boţ, Radu I.: “Accelerated Griffin-Lim Algorithm: A Fast and Provably Converging Numerical Method for Phase Retrieval”, in: IEEE Transactions on Signal Processing, 2024, Bd. 72, S. 190-202.
DOI: https://doi.org/10.1109/TSP.2023.3339232