EU AI Act - 2 авг. 2026 Проверете безплатно
Концепция

Отваряне на законите за ползване от изкуствен интелект през 21-ви век

Българското законодателство като машинно-четим, версиониран корпус — за да могат граждани, юристи, академици и AI асистенти да четат закона с еднаква точност. Преглед на идеята, ползите, изграждането и поддръжката.

Един български юрист, академик или журналист, който днес се опита да научи какво точно е казвал чл. 5 от Кодекса на труда на 4 март 2019 г., няма прост начин да отговори. Държавен вестник публикува измененията на закони отделно — по броеве, в реда на обнародване. Консолидираният текст към дадена дата трябва да се сглоби наум или с помощта на платена правна база (Сиела, Апис, Лакорда), която е достъпна за около 500 до 2000 лв. на година на работно място.

Текстът на закона е публично достояние — съгласно чл. 4 от Закона за авторското право и сродните му права държавните произведения не са обект на авторско право. Но в практиката достъпът до него е разпределен между държавна институция, която публикува измененията, и частни компании, които произвеждат сглобения и удобен за четене текст. Празнината, която остава, е забележима — и попълването ѝ е въпрос на относително проста инфраструктура.

Идеята

Идеята е една и проста. Целият корпус на българското законодателство — около 250 действащи закона, около 80 кодекса и хилядите наредби и правилници — да живее в публично кодохранилище Git. Един файл за всеки нормативен акт, в машинно-четим формат (Akoma Ntoso — международният стандарт за правни документи). Всяка промяна, обнародвана в Държавен вестник, влиза като отделна заявка за сливане (pull request), с препратка към броя на ДВ, в който е публикувана. Историята на закона е цялата на едно място, дата по дата.

Авторитативността остава непокътната. Държавен вестник продължава да бъде единственият правно обвързващ източник, съгласно чл. 5, ал. 5 от Конституцията. Кодохранилището е „удобна публикация" — модел, заимстван от Великобритания (legislation.gov.uk на The National Archives), който позволява гражданите, юристите и съдиите да четат, цитират и обработват закона свободно, без това да отнема юридическата тежест на оригиналния източник.

Текстът на закона е публичен. Сглобеният, актуален, цитируем текст към дадена дата — днес не е.

Защо точно сега

Три предпоставки се събират по едно и също време.

Първо: технологичните възможности. Машинно-четими стандарти за правни документи (Akoma Ntoso, под крилото на OASIS) са узрели и се използват от Сената на Италия, Европейския парламент и редица държавни институции. Версионираните публични кодохранилища (Git, GitHub, GitLab) са се превърнали в индустриална норма. Езиковите модели намалиха разходите за разбор на стилизирани правни инструкции с порядък в последните три години.

Второ: европейският натиск. Директивата за отворените данни (Директива (ЕС) 2019/1024), целите на „Цифровото десетилетие" и Единният цифров портал създават рамка, в която цифровизирано законодателство не е „жест на прогрес", а очаквана позиция. Същевременно Националният план за възстановяване и устойчивост (НПВУ) има пилон за цифрови публични услуги — финансова рамка, в която подобна инициатива се вписва естествено.

Трето: гражданският и икономическият натиск. Учени по право, журналисти, гражданскоправни организации, малки и средни предприятия с ограничен бюджет за юридически услуги — всички те днес или плащат на търговските бази, или работят с непрецизни копия. ЕС-съседите на България вече решават този въпрос: Естония направи избор по темата преди около 15 години, Великобритания — преди близо 20, Словакия — със Slov-lex по-наскоро.

Какво се печели

Без подреждане в политическа категория, без приоритизация — конкретни ползи за конкретни групи.

  • Граждани: безплатен и постоянно актуален достъп до текста на закона, без абонамент.
  • Юристи и съдии: коректна версия на закона към произволна минала дата, цитируема с постоянна препратка.
  • Академици: машинно-четима база за научни изследвания, без скрейпване на частни сайтове.
  • Държавна администрация: одитируемост — всяка промяна е свързана с акта, който я въвежда, и с редактора, който я е приложил.
  • Бизнес: по-ниска цена на правен преглед — особено за инвеститори, които оценяват регулаторната среда отвън.
  • Журналисти и неправителствени организации: възможност да цитират конкретна редакция на даден член, със стабилен URL към точната версия.
  • AI и иновации: чист, цитируем корпус за машинно обучение, който не зависи от съдържание на частен носител.
~250
действащи закона, около 80 кодекса и хилядите наредби и правилници — обхватът на началния корпус. Изграждането му от единствения публичен източник (Държавен вестник от 1990 г. насетне) е въпрос на 12 до 18 месеца със смесен екип от юристи и разработчици.

Процесът на изграждане

Три ясно различими фази, последователни в стартовия период и успоредни в установения режим.

1

Начален корпус — 12 до 18 месеца

Реконструкция на консолидираните текстове на действащите закони, кодекси и основните наредби. Източник: единствено Държавен вестник от 1990 г. насетне. По-старите броеве са в PDF и изискват OCR; по-новите са в HTML и са пряко обработваеми.

Има и алтернатива — започване от текстовете в съществуваща частна правна база с последваща сверка и оригинална реконструкция. Първият подход е по-чист и предотвратява спорове за интелектуална собственост. Вторият е по-бърз. Изборът е въпрос на консултация с правни и експертни специалисти преди старта.

2

Парсер на изменения — успоредно с фаза 1

Българският език на измененията е силно стилизиран — изрази като „В чл. 5, ал. 2 числото 1000 се заменя с 1500", „Член 12 се отменя" или „Създава се чл. 5а със следното съдържание…" следват ограничен набор от шаблони. Около 70 до 80 на сто от измененията се обработват с граматически базиран парсер (на технологии като Lark или nearley).

Останалите 20 до 30 на сто се предлагат от езиков модел, винаги с подпис от човек-редактор. Парсерът не замества редактора — превръща един час ръчно сглобяване в трийсет секунди преглед на готова заявка.

3

Публична инфраструктура

Кодохранилище Git с открита история на промените. Сайт за четене с постоянни URL-и, включващи дата (по модела на естонското Riigi Teataja: /акт/<име>/<дата>). Машинно API за програмен достъп. Дневни пълни снимки на корпуса за изтегляне. Лиценз CC-BY 4.0 за данните, MIT или CC0 за програмния код.

Един от съществените архитектурни избори: версиите се отбелязват към закона като цяло, не към отделните членове. Това е и моделът на Riigi Teataja, и на legislation.gov.uk — улеснява разсъжденията „как е изглеждал този закон на дата X" без да усложнява модела с разклонения на ниво член.

Поддръжката

След пускане в експлоатация дневният ритъм става предвидим.

  • 02:00 — автоматично теглене на новите броеве на Държавен вестник.
  • 02:30 — класификатор разпознава всяка точка в броя: нов закон, изменение, постановление, международно споразумение.
  • 03:00 — за всяко изменение парсерът отваря проектозаявка със своето най-добро предположение за приложението му.
  • През работното време — редактор-юрист с правни компетенции преглежда всяка заявка, поправя пропуски, потвърждава датата на влизане в сила, слива в основния клон.
  • Постоянно — открит регистър на грешки за обратна връзка от граждани и юристи.
  • Ежемесечно — версия с tag, changelog, обновяване на машинно-четимите изтегляния.

Реалистичен щатен капацитет в установен режим: един старши паралегал-редактор на пълно работно време, разработчик на половин ставка, проектов лидер на четвърт ставка. Годишен експлоатационен разход в порядъка на 200 до 300 хил. лева. Първоначалното изграждане е допълнителен ресурс — между 500 хил. и 1 млн. лева за 12-18 месеца, в зависимост от началния обхват.

Тези числа се сравняват с разходите на сродни системи в други държави: естонското Riigi Teataja и британското legislation.gov.uk оперират в порядъка на 1 до 2 млн. евро на година, при по-широк обхват и по-голям щатен състав. Българската цифра е консервативна — отразява по-малкия мащаб и по-ниските заплати в публичния сектор, без да жертва качеството.

Опитът на други държави

Подобни системи съществуват в почти всички съседни и сродни на България държави. Кратък преглед:

Държава
Каква е системата
Естония
Riigi Teataja — пълно версиониране от 2010 г.; от тогава електронното издание е официалният източник, не само удобна публикация. Институционален домакин: Държавна канцелария.
Великобритания
legislation.gov.uk — пълно версиониране, удобна публикация (отпечатаните Gazettes остават официални). Домакин: The National Archives. Документиран редакционен бек-лог като основна слабост — текстовете изостават от обнародваните изменения с месеци.
Франция
Légifrance — пълно версиониране, мащабна държавна агенция (DILA). Затворен редакционен процес, по-висок експлоатационен разход.
Германия
gesetze-im-internet.de (федерално) — без история, само текущ текст. Празнината се запълва от граждански проект bundestag/gesetze, без официална санкция.
Словакия
Slov-lex — съвременна, държавно поддържана платформа. По мащаб и институционален контекст най-близкият до България пример сред EU-съседите.

Българската позиция в момента е между германската и словашката: има публично достъпни броеве на ДВ, но без консолидиран машинно-четим вариант. Опитът на тези държави показва две неща. Първо — проектът работи най-добре, когато домакинът е статутна институция (държавна канцелария, парламентарна администрация, национална архивна служба), а не отделно министерство. Второ — редакционната прозрачност е критичен фактор за доверието. Естония постига първото; британският модел отворен код е още по-явен в проверяемостта.

Какво остава отворен въпрос

Преди подобна инициатива да напусне етапа на концепция, остават няколко принципни въпроса.

  • Институционален домакин: Народно събрание (към чиято администрация се публикува Държавен вестник) или Министерство на правосъдието? Естонският модел е по-близо до първото; политически по-видим е вторият.
  • Правен статут: удобна публикация (модел на Великобритания, без изменение в закон) или статутна реформа, в която електронното издание става съавторитетно (модел на Естония)? Първият е по-лесен за начало; вторият е дългосрочната цел.
  • Финансиране: национален бюджет, цифровият пилон на НПВУ, програмата „Цифрова Европа", „Хоризонт Европа", или комбинация? Експлоатационният разход следва да бъде устойчив без външни средства; първоначалното изграждане е по-естественият кандидат за EU-съфинансиране.
  • Връзка със съществуващите търговски бази (Сиела, Апис, Лакорда): конкуренция или съавторство? В Обединеното кралство след пускането на legislation.gov.uk търговските доставчици се преориентираха към добавени услуги — пояснения, кръстосани препратки, тематични анализи. Подобен модел е възможен и в България.
  • Покритие: само закони и кодекси за първа версия, или веднага и наредби, постановления, инструкции? Опитът на други държави показва, че по-малкият първоначален обхват се изгражда по-бързо и по-сигурно — разширяването идва на по-късен етап.

Тези въпроси не пречат на концепцията да бъде формулирана. По-скоро очертават кои решения принадлежат на политическо обсъждане и кои са технически.

Бележка от CNTS

Този текст е публикуван от Център за Нови Технологични Системи като принос към обсъждането на темата. CNTS работи с публични и частни институции в България в областта на обратната връзка от граждани и клиенти, обработката на данни и интегрирането на AI инструменти в производствени процеси — kazva.bg, cnts.bg, blitzpoll.com, makeaifriendly.com.

Ако работите по тази тема — академична общност, неправителствена организация, държавна институция, или просто като гражданин с професионален интерес — пишете на marketing@cnts.bg.

Речник

Akoma Ntoso
Международен XML стандарт за машинно-четими правни документи, под крилото на OASIS. Използва се от Сената на Италия, Европейския парламент и редица държавни институции.
Държавен вестник (ДВ)
Официалното издание на Народното събрание, единственият правно обвързващ източник за обнародване на закони и подзаконови актове съгласно чл. 5, ал. 5 от Конституцията.
Git
Разпределена система за версионен контрол, на която работят почти всички съвременни софтуерни проекти.
Pull request
Заявка за сливане — предложена промяна в Git кодохранилище, която преди приемане се преглежда от друг член на екипа.
Консолидиран текст
Пълната редакция на закона към дадена дата, със заложени всички предхождащи изменения. Различен от единичния брой на ДВ, който публикува само самото изменение.
Машинно-четим
Формат, който компютърна програма може да чете и обработва без отделен разбор — за разлика от свободно форматирания текст в PDF или HTML.
Riigi Teataja
Естонското официално издание на законите, в електронен формат, със статут на единствен официален източник от 2010 г. насетне.

Бележка към читателя

Темата няма да напусне дневния ред

Цифровизацията на правната инфраструктура е въпрос, който България ще обсъжда през следващите няколко години независимо от това чий е политическият мандат — заради европейските срокове, заради зреещата технология и заради нарастващия граждански, академичен и бизнес интерес. Целта на този текст е да опише какво представлява един от възможните формати, без предписания за това кой и кога трябва да го реализира.

Обратна връзка, корекции, допълнения — marketing@cnts.bg.