Forscher entwickeln eine KI, die Fotos unscharf machen kann

4155
Christopher Wade

Haben Sie jemals für Gruppen-Selfies und Porträts posiert, nur um festzustellen, dass Ihr Gesicht verschwommen war, weil Sie nicht aufhören konnten, über einen lahmen Witz zu lachen, den ein Freund von Ihnen gerade geknackt hat? Ich habe und es ist ziemlich entmutigend, die Ergebnisse zu sehen. Um dieses Problem zu lösen, haben Forscher des Inception Institute of Artificial Intelligence, des Beijing Institute of Technology und der Stony Brook University eine KI entwickelt, mit deren Hilfe menschliche Gesichter in Bildern unscharf gemacht werden können.

Die Forscher haben ihre Ergebnisse in einem Artikel mit dem Titel "Human-Aware Motion Deblurring" veröffentlicht. Sie behaupten, dass ihre Methodik besser funktioniert als bestehende Methoden zum Entgraten von Bewegungen.

Der Vordergrund und der Hintergrund eines Bildes unterliegen aufgrund verschiedener Faktoren, einschließlich der Relativbewegung zwischen Kamera und Objekten, der Entfernung und der Bildebene, unterschiedlichen Arten der Bildverschlechterung.

In der Arbeit schlagen die Forscher vor, a menschbewusstes Entgratungsmodell basierend auf einer "Triple-Branch Encoder-Decoder-Architektur", die in der Lage ist, die Bewegungsunschärfe zwischen Vordergrundmotiven (menschlichen Gesichtern) und dem Hintergrund zu beheben.

In der dreifach verzweigten Encoder-Decoder-Architektur ist die Die ersten beiden Zweige sind dafür verantwortlich, den Menschen im Vordergrund und die Hintergrunddetails zu schärfen während der dritte Zweig die Entgratungsinformationen der beiden anderen Zweige zusammenführt.

Im Rahmen der Forschung erstellten die Wissenschaftler einen Datensatz, den sie HIDE (Humanaware Image DEblurring) nennen. Der HIDE-Datensatz besteht aus 8.422 Bildpaaren, die mit einer Hochgeschwindigkeitskamera extrahiert wurden. Jedes Paar enthält ein verschwommenes Bild und das entsprechende scharfe Bild.

Ihr Modell wurde auf einer Nvidia Titan X-GPU unter Verwendung des HIDE-Datensatzes und eines Datensatzes trainiert, der aus unscharfen und scharfen Bildern von 720p GoPro Hero-Kameravideos mit 240 Bildern pro Sekunde besteht, was insgesamt 10.742 Bilder ergibt. Die Forscher erwähnen, dass der GoPro-Datensatz nur zum Trainieren des Hintergrunddecoders verwendet wurde, da er nur sehr wenige Fußgänger hatte.

Weitere Informationen zum System finden Sie im Forschungsbericht hier. Sie können den HIDE-Datensatz hier herunterladen. Was denken Sie über diese vorgeschlagene Methodik? Sag es uns in den Kommentaren.


Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.