Co to jest aparat AI i jak działa edycja zdjęć AI?

Sztuczna inteligencja (AI) jest wszędzie, a jeśli nie masz jeszcze smartfona ze sztuczną inteligencją, prawdopodobnie wkrótce to zrobisz. Nawet oprogramowanie Twojego telefonu wykorzystuje sztuczną inteligencję do podejmowania decyzji w Twoim imieniu. Właśnie uruchomiona kamera Adobe Photoshop Camera wykorzystuje sztuczną inteligencję do identyfikowania obiektów i scen na zdjęciach oraz sugeruje „soczewki” (efekty cyfrowe), które nadają komiksowy i twórczy efekt.

Czy to tylko pycha marketingowa, czy też sztuczna inteligencja w smartfonie - a zwłaszcza w jego aparacie - jest czymś, do czego wszyscy powinniśmy dążyć? Ponieważ termin sztuczna inteligencja jest coraz częściej używany nie tylko w telefonach z aparatem, ale we wszystkich rodzajach aparatów, warto wiedzieć, co sztuczna inteligencja robi dla twoich zdjęć.

Sztuczna inteligencja zatarła granice między robieniem zdjęć, ulepszaniem obrazu i obróbką obrazu. Służy do edycji zdjęć, łączenia, ulepszania i „rozszerzania” rzeczywistości, dokonywania bardziej inteligentnych wyborów obiektów, dopasowywania parametrów przetwarzania do tematu i pomocy w automatycznym wyszukiwaniu obrazów na podstawie tego, co jest na zdjęciach, a nie ręcznych słów kluczowych i opisy. Patrzy już na to, co fotografujesz, i samodzielnie decyduje, jak sobie z tym poradzić.

Witamy w nowym wspaniałym świecie kamer AI.

Co to jest AI?

Sztuczna inteligencja to gatunek informatyki, który bada, czy możemy nauczyć komputer myślenia lub przynajmniej uczenia się. Zasadniczo dzieli się na podzbiory technologii, które próbują naśladować to, co robią ludzie, takie jak rozpoznawanie mowy, dyktowanie głosu na tekst, rozpoznawanie obrazu i skanowanie twarzy, widzenie komputerowe i uczenie maszynowe.

Wokół tego tematu istnieje cała grupa modnych słów. „Sztuczna inteligencja”, „uczenie głębokie”, „uczenie maszynowe” i „sieci neutralne” są ze sobą powiązane w tej nowej gałęzi technologii.

Co to ma wspólnego z aparatami? Fotografia obliczeniowa i oszczędzająca czas edycja zdjęć, oto co. I aktywacja głosowa.

Kamery aktywowane głosem

Zdolność komputera do rozumienia ludzkiej mowy jest formą sztucznej inteligencji i od kilku lat wkrada się do kamer.

Smartfony oferują Google Now i Siri od kilku lat, podczas gdy Alexa wchodzi do domów przez głośniki Amazon Echo. Kamery sportowe weszły na tę modę w ostatnich latach, dzięki kamerom sportowym GoPro, a nawet kamerom samochodowym, które są w stanie podejmować działania, gdy wypowiadasz proste frazy, takie jak „rozpocznij wideo”, „zrób zdjęcie” i tak dalej.

To wszystko ma sens, zwłaszcza w przypadku kamer sportowych, w których obsługa bez użycia rąk znacznie ułatwia ich obsługę, ale czy to naprawdę sztuczna inteligencja? Technicznie tak jest, ale do niedawna gadżety aktywowane głosem były po prostu określane jako „inteligentne”. Niektórzy pozwalają teraz na powiedzenie całkiem konkretnych rzeczy, takich jak „zrób film w zwolnionym tempie” lub „zrób zdjęcie w słabym świetle”, ale kamera AI musi zrobić trochę więcej, aby zasługiwać na swoją nazwę.

Oprogramowanie AI

Sztuczna inteligencja dotyczy nowych rodzajów oprogramowania, początkowo w celu zrekompensowania braku obiektywów zmiennoogniskowych w smartfonach. „Oprogramowanie staje się coraz ważniejsze dla smartfonów ze względu na fizyczny brak optyki, więc widzieliśmy rozwój fotografii obliczeniowej, która próbuje odtworzyć zoom optyczny” - mówi analityk obrazowania Arun Gill, starszy analityk rynku w firmie Futuresource Consulting . „Najlepsze smartfony są coraz częściej wyposażone w aparaty z dwoma obiektywami, ale Google Pixel 3 wykorzystuje pojedynczy obiektyw aparatu z fotografią obliczeniową do replikacji zoomu optycznego i dodawania różnych efektów”.

Od czasu Pixela 3 macierze wielu kamer i obrazowanie obliczeniowe połączyły się, tworząc technologię hybrydową, która replikuje wiele efektów głębi ostrości i obiektywów, które można uzyskać z większych kamer. Telefon z aparatem nie jest już „tylko” aparatem. To obliczające, analizujące, „myślące” urządzenie, które nie tylko rejestruje scenę taką, jaka jest, ale także to, jak myśli, że chcesz, aby była, lub jak uważa, że ​​powinieneś chcieć, aby była…

AI może być jak wszechwiedzący asystent. Po chwili możesz zacząć się zastanawiać, kto faktycznie tu rządzi.

Świat niekoniecznie jest gotowy na pełne implikacje kamer AI. Google użył sztucznej inteligencji w swoim noszonym aparacie Google Clips, który wykorzystywał sztuczną inteligencję do rejestrowania i zachowywania tylko szczególnie niezapomnianych chwil. Wykorzystał algorytm, który rozumiał podstawy fotografii, więc nie tracił czasu na przetwarzanie zdjęć, które z pewnością nie byłyby ostatecznym wycięciem w rolce z najciekawszymi momentami. Na przykład automatycznie usuwał zdjęcia z palcem w kadrze i nieostre obrazy, a faworyzował te, które są zgodne z ogólną zasadą trójpodziału dotyczącą kadrowania zdjęcia.

Przerażające i kontrolujące? Niektórzy tak myśleli. W każdym razie Google wyciągnął aparat w 2022-2023 roku. Pytanie nie dotyczy tego, czy sztuczna inteligencja jest wystarczająco potężna, aby robić rzeczy, które chcemy, ale czy jesteśmy jeszcze gotowi, aby przekazać tak dużą moc maszynie… lub firmie, która posiada i obsługuje algorytmy sztucznej inteligencji, które za nią stoją.

Co to jest fotografia obliczeniowa?

Fotografia obliczeniowa to technika cyfrowego przetwarzania obrazu, która wykorzystuje algorytmy do zastępowania procesów optycznych i ma na celu poprawę jakości obrazu poprzez wykorzystanie widzenia maszynowego do identyfikacji treści obrazu.

„Chodzi o to, aby uzyskać efekty studyjne, które można uzyskać za pomocą programów Lightroom i Photoshop, i udostępnić je użytkownikom za pomocą jednego kliknięcia” - mówi Simon Fitzpatrick, starszy dyrektor ds. Zarządzania produktem w FotoNation, który dostarcza znaczną część technologii obliczeniowej markom aparatów fotograficznych.

„Dzięki temu możesz wygładzić skórę i pozbyć się wyprysków, ale nie tylko rozmazując ją - otrzymujesz również teksturę”. W przeszłości technologia stojąca za trybami „gładkiej skóry” i „piękna” polegała zasadniczo na rozmywaniu obrazu w celu ukrycia niedoskonałości. „Teraz chodzi o stworzenie wiarygodnego wyglądu, a sztuczna inteligencja odgrywa w tym kluczową rolę” - mówi Fitzpatrick. „Na przykład używamy sztucznej inteligencji do uczenia algorytmów dotyczących cech twarzy ludzi”.

Już w telefonie LG V30S ThinQ firma LG wykorzystywała sztuczną inteligencję do obrazowania. Pozwala użytkownikowi wybrać profesjonalny obraz w aplikacji Graphy i zastosować ten sam balans bieli, czas otwarcia migawki, przysłonę i ISO. Firma LG wprowadziła również Vision A, silnik rozpoznawania obrazu, który wykorzystuje sieć neuronową wyszkoloną na 100 milionach obrazów, który zaleca, jak ustawić kamerę. Wykrywa nawet odbicia na obrazie, kąt ujęcia i ilość dostępnego światła.

Czujniki głębi i rozmyte tło

W ostatnich latach widzieliśmy, że wiele wieloobiektywowych aparatów telefonicznych używa dwóch lub więcej obiektywów do tworzenia estetycznie zadowalających obrazów z rozmytym tłem wokół głównego obiektu. Ludzie (a więc i Instagram) uwielbiają rozmyte tła, ale zamiast korzystać z aparatów z dwoma obiektywami lub podnosić lustrzankę cyfrową i ręcznie manipulować głębią ostrości, sztuczna inteligencja może teraz zrobić to za Ciebie.

Powszechnie nazywany efektem „bokeh” (po japońsku rozmycie), uczenie maszynowe identyfikuje obiekt i rozmywa resztę obrazu. „Możemy teraz symulować efekt bokeh za pomocą algorytmów opartych na sztucznej inteligencji, które dzielą ludzi na pierwszy plan i tło, dzięki czemu możemy stworzyć efekt, który zaczyna wyglądać bardzo podobnie do portretu zrobionego w studio” - mówi Fitzpatrick. Najnowsze smartfony pozwalają na to w przypadku zdjęć wykonywanych zarówno tylnym, jak i przednim (selfie) aparatem.

„Ludzie nazywają to bokeh, ale nie można uzyskać prawdziwego rozmycia, jaki można uzyskać za pomocą lustrzanki cyfrowej, w której można zmienić głębię; telefonem można jedynie rozmyć tło ”- mówi Gill. „Jednak mała i stale rosnąca liczba fotografów jest pod wrażeniem i używa iPhone'a X do codziennego robienia zdjęć i tylko wtedy, gdy wykonują pracę zawodową, wyjmą lustrzankę cyfrową”.

Kamery AI mogą automatycznie łączyć obrazy HDR w jasnym świetle, przełączać się w tryb przechwytywania wielu obrazów przy słabym oświetleniu i wykorzystywać magię obrazowania obliczeniowego, aby stworzyć efekt płynnego powiększania za pomocą dwóch lub więcej modułów aparatu.

A co z lustrzankami cyfrowymi i innymi „odpowiednimi” aparatami?

Automatyczne usuwanie efektu czerwonych oczu jest stosowane w lustrzankach cyfrowych od lat, podobnie jak wykrywanie twarzy, a ostatnio nawet wykrywanie uśmiechu, dzięki czemu selfie jest robione automatycznie, gdy obiekt się uśmiecha. To wszystko to sztuczna inteligencja. Czy firmy takie jak Nikon i Canon kiedykolwiek zastosują bardziej zaawansowaną sztuczną inteligencję w swoich flagowych lustrzankach cyfrowych? W końcu minęło wiele lat, zanim WiFi i Bluetooth pojawiły się na lustrzankach cyfrowych.

Podczas gdy my czekamy, finansowany z Kickstarter „asystent inteligentnego aparatu” o nazwie Arsenal chce wypełnić tę lukę. „Arsenal to akcesorium, które umożliwia bezprzewodowe sterowanie aparatem z wymiennymi obiektywami (np. Lustrzanką cyfrową) z urządzenia mobilnego, z algorytmami uczenia maszynowego używanymi do wykonania idealnego zdjęcia” - mówi Gill. „To, co robi, to porównywanie bieżącej sceny z tysiącami wcześniejszych obrazów, używanie funkcji rozpoznawania obrazu do rozpoznawania konkretnego obiektu i stosowanie prawidłowych ustawień, takich jak krótki czas otwarcia migawki, jeśli rozpoznaje dziką przyrodę”.

W międzyczasie Canon mocno oparł się na technologii AI w najnowocześniejszym systemie autofokusa w aparacie EOS-1D X Mark III. Lub, mówiąc dokładniej, „uczenie głębokie”. Złożoność algorytmów jest taka sama (system jest szkolony przy użyciu profesjonalnych zdjęć), ale efektem końcowym jest głębokie uczenie się… sztuczna inteligencja to zdolność maszyny do samodzielnego uczenia się.

Jednak oddzielenie prawdziwej sztucznej inteligencji od zaawansowanej automatyzacji może być trudne. Od lat producenci aparatów kompaktowych oferują różne programy tematyczne zorientowane na obiekt, które mogą być wybierane automatycznie przez aparat. Czy to „inteligencja”, czy po prostu nieco bardziej zaawansowana implementacja pomiaru ekspozycji, ruchu obiektu i odległości ogniskowania? Wielopunktowe systemy pomiarowe zazwyczaj wykorzystują złożone pomiary rozkładu światła na podstawie tysięcy rzeczywistych zdjęć i wykorzystywały proces „głębokiego uczenia się” jeszcze przed wynalezieniem tego terminu.

Dla kogo jest fotografia AI?

Wszyscy. Na początek chodzi o demokratyzację fotografii. „W przeszłości fotografia była domeną tych, którzy mieli doświadczenie w używaniu lustrzanki cyfrowej do tworzenia różnych typów obrazów, a sztuczna inteligencja zaczęła robić, aby udostępniać efekty i możliwości bardziej zaawansowanej fotografii większej liczbie osób” - mówi Fitzpatrick .

Czy to oznacza, że ​​programy Adobe Photoshop i Lightroom wkrótce przestaną działać? Absolutnie nie; Sztuczna inteligencja jest technologią uzupełniającą i już teraz znacznie bardziej zautomatyzuje edycję zdjęć. Jednym z partnerów FotoNation jest Athen Tech, którego technologia oparta na sztucznej inteligencji „Perfectly Clear” przeprowadza automatyczne poprawki partii, które naśladują ludzkie oko. Wtyczka do programu Lightroom, której celem jest skrócenie czasu spędzanego przez fotografów przed komputerami, które ręcznie edytują. „Profesjonalni fotografowie zarabiają na robieniu zdjęć poza domem, a nie na ich przetwarzaniu” - mówi Fitzpatrick. „Sztuczna inteligencja sprawia, że ​​profesjonalnie wyglądające efekty twórcze są bardziej dostępne dla użytkowników smartfonów i pomaga profesjonalnym fotografom zmaksymalizować ich możliwości zarabiania na życie”.

Sztuczna inteligencja szybko staje się nadużywanym terminem w świecie fotografii. Obecnie dotyczy to głównie aparatów w smartfonach, ale niewiarygodne algorytmy i sam poziom zautomatyzowanego oprogramowania, na które pozwala ta technologia, wkrótce okażą się nieodparte dla większości z nas. Być może nie nadszedł jeszcze czas, aby wyrzucić lustrzankę cyfrową, ale wydaje się, że sztuczna inteligencja zmieni sposób, w jaki robimy zdjęcia.

Nie tylko to, ale wkrótce może zająć się edycją i opieką nad naszymi istniejącymi bibliotekami fotografii. Ten proces już się rozpoczął. Lightroom CC korzysta z opartego na serwerze systemu rozpoznawania obiektów Sensei firmy Adobe, aby identyfikować obrazy według tematyki, dzięki czemu nie musisz już spędzać godzin na ręcznym dodawaniu słów kluczowych. Sztuczna inteligencja może być przesadnym terminem i często skrótem dla czegoś, co jest niczym innym jak najnowszym, najbardziej zaawansowanym oprogramowaniem, ale sztuczna inteligencja obiecuje zrobić coś niesamowitego dla fotografów; pozwoli to zaoszczędzić więcej czasu, dzięki czemu będziesz mógł robić więcej i lepiej robić zdjęcia.

Dlaczego niektóre telefony mają dwie kamery po jednej stronie? Wyjaśnienie konstrukcji dwóch aparatów

Skylum Software jest jednym z liderów oprogramowania do edycji zdjęć opartego na sztucznej inteligencji. Wprowadził AI Sky Replacement w Luminar, aby wyeliminować wszystkie ręczne maskowanie potrzebne do zrobienia tego ręcznie, AI Augmented Skies, aby dodać chmury, planety, błyskawice i inne elementy do twoich obrazów, narzędzia do ulepszania portretu AI, które mogą autonomicznie identyfikować cechy ludzkie, oraz Structure AI. aby dodać definicję tylko do tych obszarów obrazu, w których jest to stosowne.

Wykorzystanie rzeczywistości rozszerzonej w fotografii może jednak budzić kontrowersje. Od czasu wynalezienia edytorów obrazów można było zniekształcać, przekręcać i „wymyślać” rzeczywistość, ale sztuczna inteligencja obiecuje uczynić to tak prostym i tak przekonującym, że nie wymaga do tego żadnych szczególnych umiejętności (ani sumienia).

• Najlepsze telefony z aparatem, jakie możesz dziś kupić
• Najlepsze oprogramowanie do edycji zdjęć w tej chwili
• Jak pobrać program Photoshop
• Jak pobrać Lightroom

Interesujące artykuły...