Python programátor doporučování a ML klasifikátorů pro Lide.cz

Pracujeme na nové generaci serveru Lide.cz – pojďte s námi porazit ostatní sociální platformy. Každý den zaznamenáváme zhruba 2 miliony zobrazení embedu, vyšší desítky tisíc nových komentářů a vyšší stovky tisíc lajků. V posledních letech šlapeme do integrace velkých jazykových modelů a píšeme si vlastní jednoduché klasifikátory i doporučovací systém.

Na čem pracujeme a na co se můžete těšit?

  • jednoduché klasifikátory a signály z chování uživatelů a komentářů,
  • doporučovací logiku (personalizace, trendy, relevance),
  • podobnost obsahu/uživatelů, včetně práce s vektory a jejich vyhledáváním,
  • integraci velkých jazykových modelů do reálného provozu.
  • Píšeme v Pythonu 3, používáme FastAPI, Flask, Strawberry nebo SQLAlchemy.
  • Využíváme Git. Nad každou provedenou změnou v kódu se automaticky spustí testy, zabalí se do docker kontejneru a nasadí se do Kubernetes.
  • Provozujeme SCRUM a nezapomínáme na Code review.
  • Pracujeme v menších vývojových týmech o cca pěti až osmi vývojářích. S ostatními týmy v naší divizi sdílíme technologický základ, takže si rádi pomáháme a předáváme znalosti.
  • Jsme u celého procesu vývoje – od nápadu, přes návrh architektury až po samotnou implementaci v námi zvolených technologiích.

Hledáme kolegu, který...

  • má zkušenost s backendem v Pythonu,
  • má znalost asynchronního programování a umí navrhovat věci tak, aby fungovaly i ve velkém provozu,
  • přemýšlí o výkonu, latenci, cachování a škálování (aplikace i databáze),
  • nám pomůže vylepšit a dále rozvíjet náš doporučovací algoritmus, konkrétně:
    • ví, co je kolaborativní filtrování, podobnost uživatelů/obsahu, případně ranking,
    • řešil nebo chce řešit vyhledávání podobných vektorů / embeddingy / NN,
  • má chuť podílet se na vývoji sociálních prvků Seznamu,
  • rád pracuje v týmu, zajímá se o nové trendy, učí se novým věcem a sdílí svoje know-how s ostatními,
  • nebojí se řešit zajímavé problémy a přemýšlí nad nimi.

Jaké zkušenosti navíc oceníme?

  • Zkušenost s distribuovanou architekturou a Kafkou.
  • Zabýval(a) jste se performance optimalizacemi aplikace či databáze.
  • V minulosti jste již pracoval(a) na doporučovacích algoritmech.
  • Hlubší znalosti databází:
    • Elasticsearch (fulltext / relevance / agregace / vektorové hledání),
    • Redis (cache / pipeliny / sorted sety / optimalizace),
    • PostgreSQL (optimalizace dotazů, komplexní práce s daty).

Jak probíhá výběrové řízení?

  1. Prescreen
    Úvodní call, kde si sladíme očekávání a projdeme vaše zkušenosti.
  2. Technický test – Codility
    Online doma
  3. Technický pohovor
    Osobně v Praze.

Podobné inzeráty

Heureka Group a.s.

Data Analytik (Merchant Analytics team)

Heureka Group a.s.| Cukrovarská/20, Plzeň, CZ
Práce na plný úvazek Zatiaľ zareagovalo menej ako 5 ľudí
ATALIAN CZ s.r.o.

ÚKLIDOVÝ PRACOVNÍK/CE, Brno - Královo pole - bankovní prostory

ATALIAN CZ s.r.o.| Brno, CZ
Brigáda Zatiaľ zareagovalo menej ako 5 ľudí
4 500 CZK
Adastra Czech Republic

Strategic Presales Partner - Data & Analytics (ref VV)

Adastra Czech Republic| Karolinská 706/3, Praha 8, CZ
Práce na plný úvazek Buďte medzi prvými!
ATALIAN CZ s.r.o.

ÚKLIDOVÝ PRACOVNÍK/CE, Kuřim - lékárna

ATALIAN CZ s.r.o.| Kuřim, CZ
Brigáda Buďte medzi prvými!
150 CZK za hodinu
Notino, s.r.o.

UX Designer se zaměřením na Design System

Notino, s.r.o.| Londýnské náměstí 1036/3, Brno-střed, CZ
Práce na plný úvazek Buďte medzi prvými!