Aplikacja Krytyczne to spółka, która jednocześnie jest najpotężniejszych broni Ministerstwa Finansów walce z nierzetelnymi podatnikami. Ta spółka ma pozyskiwać i przetwarzać wszystkie dane, jakie pozyskuje resort finansów o podatnikach. O tym, co robią Aplikacje Krytyczne, rozmawialiśmy w trakcie ubiegłotygodniowego kongresu Impact fintech’17 z prezesem spółki, Piotrem Towarkiem.

Jaką ilość danych Aplikacje Krytyczne już zgromadziły i jak ta ilość będzie rosła w kolejnych miesiącach?

Piotr Towarek, prezes spółki Aplikacje Krytyczne Z danych otrzymanych z Jednolitego Pliku Kontrolnego mamy obecnie ponad 1,5 mld faktur, zebranych w ciągu 10 miesięcy. To jest 1 TB danych i spodziewamy się, że ta ilość danych będzie przyrastała w tempie 1 TB na miesiąc. Ale gromadzimy dane z różnych źródeł, część pochodzi z różnych systemów, część z różnych hurtowni danych, gdzie są one już skonsolidowane. Wszystkie dane wpływają do Fundamentu Danych, a więc naszej podstawowej aplikacji, gromadzącej informacje o podatniku.

Tych danych będzie przybywać, gdyż wkrótce obowiązkiem wysyłania JPK zostaną objęci mikroprzedsiębiorcy. Oznacza to, że do obecnych ponad 100 tys. podmiotów, w przyszłym roku dołączy ponad 1, 5 mln nowych. Przy czym wzrost liczby faktur nie będzie kilkunastokrotny, jak wynika z samej liczby podmiotów – liczymy się raczej ze wzrostem 3-, 4-krotnym. Jesteśmy w procesie wdrażania zaawansowanych narzędzi analityki big data odpowiedniej do takiej liczby danych.

Skąd pobierane są dane, które trafiają potem do Aplikacji Krytycznych i do Fundamentu Danych?

Dane pochodzą z trzydziestu różnych źródeł. Jednym z głównych są systemy poltaxowe, gdzie znajdują się deklaracje podatkowe, dane z systemów ewidencji podatników, systemów celnych czy tych, które obsługują kontrole podatkowe, prowadzone przez urzędników skarbowych.

Czy podbieracie dane z systemów ZUS?

Korzystamy wyłącznie ze źródeł Ministerstwa Finansów. ZUS zaś nie jest takim źródłem.

Czemu? Wydawałoby się, że ZUS jest świetnym źródłem danych o sytuacji firmy.

Naszym celem jest zbudowanie systemu, który pozwoli na tworzenie holistycznej informacji o podatniku. Obecnie koncentrujemy się na systemach, które są w posiadaniu MF. Dopiero kiedy ok. 80 proc. tych systemów zostanie skonsolidowanych, będziemy sięgać po inne dane, z rejestrów. Jednak na razie jest sporo do zrobienia w samym resorcie finansów, który ma kilkadziesiąt dużych systemów i setki mniejszych.

Czyli te systemy wcześniej nie były skorelowane?

To są systemy wyspowe, odrębne, i choć były połączone, to dotyczyło to różnych obszarów. Wiadomo, że służba celna ma swoje systemy i hurtownie danych, mają je również urzędy skarbowe, jednak informacja o podatniku nie przepływała bezpośrednio między służbami. Tak właśnie wyglądała polska administracja skarbowa przed powstaniem Krajowej Administracji Skarbowej, której jednym z priorytetów jest usprawnienie wymiany danych i ich konsolidacja .

A czy obecnie celnik ma już dostęp do wszystkich informacji o podatniku, również tych pochodzących z danych urzędów skarbowych?

Obecnie powstaje narzędzie, w którym analitycy po zalogowaniu się dostaną kompleksową informację. A więc na jednym ekranie widzą krótki scoring podatnika, informacje o tym, czy ma on zaległości, czy była tam prowadzona kontrola i kiedy się ona odbywała. To pozwoli uzyskać także dostęp do danych z systemów źródłowych. Jesteśmy już na etapie pilotażu, który obejmuje znaczącą, jak na pilotaż, liczbę 10 tys. użytkowników.

Czy na podstawie zebranych danych udało się już wyłuskać jakieś ciekawe korelacje, które np. pokazują sezonowość w jakości płacenia podatków?

Aplikacje Krytyczne dostarczają technologię i budują techniczną część analityki. Do prowadzenia analiz merytorycznych dedykowani są eksperci i analitycy w poszczególnych departamentach Ministerstwa Finansów, gdyż to one są konsumentem danych. My jesteśmy częścią technologiczną, podrzucamy pomysły, jak analizy prowadzić. Ostatnio na przykład prowadziliśmy analizę tego, jak podatnicy z poszczególnych grup przedsiębiorstw – małych, średnich i dużych – ze sobą współpracują, ile faktur między nimi krąży.

Wiadomo, że Ministerstwo Finansów i Krajowa Administracja Skarbowa – za pośrednictwem Aplikacji Krytycznych – ogłosiło konkursy, aby pozyskać nowe rozwiązania i jednocześnie wyłuskać z rynku ludzi, którzy mogliby pracować w Pańskiej firmie. Czego dotyczyły te konkursy?

Zadanie, które postawiliśmy w trakcie krakowskiego hackathonu , dotyczyło stworzenia narzędzia, które umożliwiłoby wyszukanie w serwisach internetowych podejrzanych aukcji. Chodzi o aukcje, na których sprzedawana jest elektronika uznawana za używaną, a w rzeczywistości jest nowa. Na podstawie pewnych cech tych aukcji można uznać, że a mają one znamiona oszustwa. Przed startem zadania przygotowaliśmy listę referencyjna takich aukcji. Podczas hackathonu blisko 2000 uczestników miało możliwość wyboru zadania MF i szukać oszustów VATowskich na portalach aukcyjnych. Celem było stworzenie rozwiązania, które umożliwi automatyczne znajdywanie takich podejrzanych aukcji. Hackathon był pierwszym etapem konkursu MinFinTech – rodzajem preselekcji kandydatów do konkursu właściwego.

Najlepszych zaprosiliśmy bowiem do II etapu, który trwa obecnie – wyniki Konkursu zostaną ogłoszone 19 grudnia. W tym etapie MinFinTech są dwa zadania. Pierwsze dotyczy tego, aby przeszukać zagraniczne rejestry nierzetelnych podatników pod kątem podmiotów, które w Polsce prowadzą kilka czy kilkanaście firm. Istnieje bowiem ryzyko, że jeśli ktoś – np. na Słowacji – ma kilkanaście firm i są one zaliczone do grona nierzetelnych podatników, to wkrótce prowadzone przezeń firmy w Polsce również przestaną płacić podatki czy w ogóle znikną z rynku.

Drugie zadanie dotyczy stworzenia samouczącego się algorytmu, który będzie w stanie porównywać faktury sprzedażowe i zakupowe, aby tworzyć z nich parę. Wiadomo bowiem, że podatnicy w numeracji faktur potrafią wpisywać przedziwne rzeczy. Celem zadania jest przeszukiwanie faktur i wyłowienie w masowej skali tych, które są ze sobą powiązane..

Dziękuje za rozmowę.