Algorytm szuka kodu na bestseller

2020-07-05 13:59:00(ost. akt: 2020-07-03 18:28:21)
Małgorzata Sieniewicz, dr Krzysztof Sopyła i Urszula Witkowska

Małgorzata Sieniewicz, dr Krzysztof Sopyła i Urszula Witkowska

Autor zdjęcia: Literacka

Literacka to olsztyńska firma, w której humaniści ramię w ramię z informatykami pracują nad tym, aby wspierać ludzi, dla których świat bez książek nie miałby sensu. Ostatnio postanowili wykorzystać sztuczną inteligencję do tego, żeby... znaleźć kod na bestseller.
Asystent Wydawniczy to narzędzie, które wykorzystuje sztuczną inteligencję do analizy treści, stylu i przewidywania sukcesów rynkowych publikacji. Na prace nad nim Literacka dostała dofinansowanie z Narodowego Centrum Badań i Rozwoju. Olsztyńska firma ma na swoim koncie kilka ciekawych projektów, które na pierwszym planie stawiają literaturę i ludzi z nią związanych. Za Wirtualnego Księgarza, czyli narzędzie służące do rekomendacji książek, jego twórcy odebrali wyróżnienie w konkursie Orły Innowacji.

Z trzonem Literackiej, czyli Małgorzatą Sieniewicz, Urszulą Witkowską i dr. Krzysztofem Sopyłą, rozmawiamy o szansach, jakie opracowywane przez nich narzędzie daje nie tylko wydawcom, ale i autorom.

— Narodowe Centrum Badań i Rozwoju przyznało wam dofinansowanie na pracę nad Asystentem Wydawniczym. Czym się zajmie to narzędzie?

Urszula Witkowska: — Mówiąc najprościej, analizą tekstu. To stanowi punkt wyjścia naszych badań. Asystent Wydawniczy to właściwie kontynuacja prac, które realizowaliśmy przez ostatnie dwa lata w ramach projektu Automatyczny Recenzent, również wspartego przez NCBiR. Przy pierwszym projekcie szukaliśmy sposobu, jak z pomocą sztucznej inteligencji wspierać czytelników w wyborze kolejnych książek do czytania, tym razem pochylamy się nad tym, jak usprawnić proces wydawniczy.

— Czyli chcecie wyręczyć wydawców?
UW: — Nasz program ma ich raczej wspomóc w tym, czym się zajmowali (albo się nie zajmowali z uwagi na zbyt wiele tekstów, które do nich napływają). To także wsparcie dla pracowników działów marketingu, którzy mają za zadanie książkę wypromować Na podstawie analizy treści całej książki możemy wydać taki wczesny alert: „Wśród setek tekstów jest taki, na który powinieneś zwrócić uwagę, bo, na przykład, pasuje do wybranej serii wydawniczej czy planu wydawniczego”.

— Autor też może skorzystać na waszej pracy?
UW: — Oczywiście. Otrzyma różne wskazówki, które mogą mu się przydać albo na etapie pracy nad tekstem, albo już później, kiedy będzie chciał podjąć decyzję, do których wydawnictw powinien wysłać swoją książkę, aby mieć jak największą szansę, że wydawca będzie zainteresowany wydaniem otrzymanego tekstu.
Małgorzata Sieniewicz: — Można powiedzieć, że szukamy kodu bestsellera, dzięki któremu wydawcy powinno zaświecić się światełko, że ta książka ma szansę się sprzedać, ma szansę dotrzeć do wybranej grupy czytelników.

— A gdzie tego kodu można szukać?
Krzysztof Sopyła: — My zaczynamy od tego, że analizujemy tekst za pomocą algorytmów sztucznej inteligencji. Z niego staramy się wyciągnąć jak najwięcej informacji na temat stylu pisania, zliczamy części mowy, długość zdań, użyte słownictwo — różne elementy, które pozwolą ocenić jakość tekstu i powiedzą wydawcy, o czym ta książka jest, do jakich kategorii można ją przyporządkować, gdzie dzieje się akcja, jak przebiega, jacy są bohaterowie... Te informacje pozyskujemy dzięki uczeniu maszynowemu i przy pomocy sieci neuronowych — tych modeli, które już istnieją np. dla języka angielskiego. Dofinansowanie z NCBiR pozwoli nam na to, by zbadać nowe obszary i wyprodukować nowe algorytmy służące do analizy języka polskiego. W przyszłości będzie też możliwe komercyjne wdrożenie naszych badań.
UW: — Robimy to po to, żeby skrócić drogę między autorem a czytelnikiem, dać ludziom możliwość odkrywania książek, które być może zginęłyby w gąszczu innych.

— Nie boicie się zarzutów o to, że odhumanizowujecie coś, co było domeną człowieka? Że oddacie — metaforycznie mówiąc — w ręce maszyny coś, co było dotąd domeną ludzi?
KS: — Ja bym powiedział raczej, że chcemy wyciągnąć obiektywne informacje, które mogą przydatne w ocenie jakości dzieła. Wyobraźmy sobie wydawnictwo, do którego miesięcznie trafia 50 tekstów, które ma czytać jedna osoba. Poświęcając każdej z tych książek tylko dwie godziny, wertując, czytając pierwsze rozdziały, musi pracować 100 godzin. A przecież taka osoba ma też inne obowiązki.

— A może rynek wydawniczy jest przeładowany? W końcu dzisiaj każdy może wydać książkę, choćby dzięki możliwościom, jakie daje self-publishing, czyli wydawanie na własną rękę. Nie doszliśmy do ściany?
MS: — Myślę, że w przypadku Polski ta ściana jest jeszcze bardzo daleko. Obserwujemy przecież rynki wydawnicze w innych krajach, w których wydaje się kilka razy więcej książek w przeliczeniu na jednego mieszkańca. Natomiast na pewno życie książki jest coraz krótsze i na pewno coraz trudniej się poruszać w zalewie tekstów. Stąd wzięła się nasza wcześniejsza praca nad systemem rekomendującym książki nie po historii zakupów, ale na podstawie cech fabuły. Teraz postanowiliśmy spojrzeć na ten rynek także z punktu widzenia wydawcy. Tytułów jest przecież coraz więcej, a czas, który można im poświęcić, czy zasoby ludzkie i ekonomiczne, pozostały często na niezmienionym poziomie.
Technologia nie zmienia rynku wydawniczego, ale raczej odpowiada na jego potrzeby. Mamy też nadzieję, że autor, który zdecyduje się samodzielnie wydać książkę, będzie mógł skorzystać z naszej pomocy, żeby lepiej dotrzeć z nią do swoich potencjalnych czytelników.

— Mówiliście o kodzie na bestseller. Czy sztuczna inteligencja, uzbrojona w opracowane przez was algorytmy, już taki przepis znalazła?
KS: — Jeszcze nie, ale mamy już koncepcję i pomysł, jak ten kod odszyfrować.
UW: — Postawiliśmy już pierwszy krok w tym kierunku, bo nasza sztuczna inteligencja może się pochwalić tym, że jest jurorem w konkursie literackim BLEF na mikropowieść sensacyjną.
MS: — Danych o tym, co decyduje o sukcesie tekstu, szukamy także analizując nagradzane książki. Mamy za sobą już takie projekty, kolejny przygotujemy przy okazji Literackiej Nagrody Warmii i Mazur „Wawrzyn”. Każdy z autorów, którego książka znajdzie się w finale tego konkursu, otrzyma od nas analizę swojej książki.

— Czy dotychczasowe prace przyniosły już jakieś powody do zdumienia? Dowiedzieliście się czegoś o rynku, o czytelnikach?
UW: — Myślę, że zaskakujące było dla nas to, że sztuczna inteligencja j przyporządkowała książki do odpowiednich kategorii gatunkowych, takich jak kryminał czy fantastyka, lepiej niż zrobili to ludzie.
MS: — Nasz projekt to także odpowiedź na potrzeby, o których mówiły nam osoby prowadzące kursy kreatywnego pisania. Podkreślali oni, co mnie nieco zaskoczyło, że taka analiza może przydać się nie tylko wydawcy, ale i samemu autorowi, bo zdarza się na przykład, że pisarz „gubi” bohaterów. Algorytm jest w stanie zauważyć, że w którymś z rozdziałów nagle zniknęła jakaś postać, która wcześniej występowała, i dzięki temu przypomnieć o niej samemu twórcy. To tradycyjne zadanie redaktora, którego zastąpić trudno, ale, tak jak mówiliśmy, chodzi nam o to, by ułatwić pracę osobom przygotowującym książkę do druku.

— Dopiero niedawno zdałam sobie sprawę z tego, jak duży jest wasz zespół...
UW: — Nasza ekipa to takie małżeństwo pasji do książek z technologią. Zaczęło się od nieśmiałych pomysłów, że fajnie byłoby zrobić coś takiego, a na dobre ruszyło wraz z konkretną decyzją o dołączeniu do nas Krzysztofa i jego ekipy programistów, którzy potwierdzili, że te nasze wizje da się zrealizować.
MS: — Warunkiem otrzymania dotacji z NCBiR jest zatrudnianie kadry badawczej, czyli osób ze stopniami naukowymi. Współpracują z nami więc specjaliści zarówno od data science, jak i literaturoznawcy czy językoznawcy.

— I te światy da się pogodzić?
KS: — Na początku były oczywiście obawy, ale okazuje się, że ta współpraca wychodzi nam naprawdę dobrze. Mamy ambicję i chęci, żeby tworzyć inteligentne technologie, które będą odpowiadać na potrzeby rynku. Ważny dla nas jest też aspekt badawczy, więc pracujemy nad tym, żeby wyniki naszej pracy publikować, dzielić się wiedzą, bezpłatnie ją udostępniać innym.

— To wszystko robicie stąd, z serca Warmii.
KS: — Nie ukrywamy swojego lokalnego patriotyzmu. Działamy w Olsztyńskim Parku Naukowo-Technologicznym i cieszymy się, kiedy spotykamy się z pozytywnymi reakcjami naszych klientów i współpracowników na to miejsce, na sam Olsztyn.

— Przedstawiciele różnych olsztyńskich firm mówią tymczasem, że klienci nie mają nawyku przyjeżdżania do Olsztyna, że czasem wydaje im się, że to daleko od Warszawy. To się zmienia?
MS: — Myślę, że tak. Coraz częściej słyszymy, że inne firmy wręcz myślą o tym, żeby mieć swoją siedzibę w Olsztynie.

— Co z planami na przyszłość?
MS: — Poza pracą nad Asystentem Wydawniczym dążymy do tego, aby nasze narzędzie rekomendujące książki trafiało do coraz większej liczby bibliotek i księgarni internetowych.

Daria Bruszewska-Przytuła



Czytaj e-wydanie
Gazeta Olsztyńska zawsze pod ręką w Twoim smartfonie, tablecie i komputerze. Codzienne e-wydanie Gazety Olsztyńskiej, a w piątek z tygodnikiem lokalnym tylko 2,46 zł.

Kliknij w załączony PDF lub wejdź na stronę >>>kupgazete.pl