Документооборот на современном предприятии. Подготовка эдт и пакета электронных документов

Имиджинг

а первом этапе перевода документа в электронную форму производится его сканирование, которое позволяет получить электронную копию документа в виде изображения. Данный процесс называют имиджингом (imaging). Таким образом, имиджинг - это процесс получения аутентичных изображений бумажных документов. Термин пришел из микрофильмирования, однако сегодня применяется именно к электронным изображениям. Имиджинг является начальным этапом любой системы ввода документов. На этом этапе выполняются задачи сканирования, обработки изображения и контроля качества (рис. 1).

Сканеры позволяют оцифровывать изображения, а также предоставляют ряд дополнительных возможностей, таких как аппаратная поддержка качества изображения и выравнивание страниц.

Выравнивание страниц может производиться как аппаратно, так и программно (рис. 2).

Если речь идет о промышленном вводе документов, то сканеры обычно предоставляют ряд дополнительных функций, например возможность подачи разноформатных документов в одной пачке, а также позволяют использовать большие пачки документов и т.д.

Обработка изображений

Как уже было отмечено, часть функций обработки изображений может быть реализована аппаратно в сканере, а может производиться на станции сканирования. Улучшение изображения включает программное выравнивание, конвертирование с улучшением качества, удаление шумовых и фоновых элементов, улучшение качества передачи текста и т.д.

Наиболее важной технологией на стадии распознавания документов является технология OCR, о которой следует рассказать более подробно.

Технологии OCR/ICR

Традиционный подход к проблеме распознавания заключается в сведении задачи распознавания к задаче классификации некоторого набора признаков. Идея проста: по изображению определяется некоторый набор признаков, который сравнивается с каждым из имеющихся образцов, так называемых эталонов. По результатам сравнения находится эталон, с которым этот набор признаков совпадает лучше всего, и изображение относится к соответствующему классу. Таким образом, все решение заключается в сравнении предлагаемого изображения с образцами и выборе наиболее подходящего; иначе говоря, производится некий перебор возможных вариантов. Проблема имела бы простое решение, если бы не существовало сотен шрифтов, полученных по факсу текстов с плохо читаемыми символами и т.д.

В качестве основных алгоритмов решения данной задачи выделяют multifont (шрифтовые) и omnifont (шрифтонезависимые) алгоритмы. В случае multifont растровое изображение накладывается на шаблон, и соответственно наиболее подходящим шаблоном считается тот, у которого наименьшее количество точек отличается от исследуемого изображения. Omnifont-алгоритмы идентифицируют символ по правилам его написания. В этом случае эталон, с которым производится сравнение, содержит в себе информацию о правилах написания символа. Оба алгоритма имеют вероятностную природу и позволяют сделать предположение о принадлежности данного символа. Основная задача при распознавании текстов - это повышение вероятности принятия правильного решения, то есть уменьшение доли ошибок. Существует несколько подходов к повышению качества распознавания. Например, алгоритм может содержать комбинацию шрифтового и шрифтонезависимого подхода. Существенное увеличение точности распознавания достигается за счет использования самообучения системы. Это позволяет, например, распознавать плохо пропечатанные символы с помощью шрифта, созданного на основе достаточно хорошо пропечатанных символов. Следует отметить, что на текстах хорошего качества лучше работают одни алгоритмы, на текстах плохого качества - другие, а для распознавания табличных форм удобнее использовать третьи и т.д. Существуют подходы, при которых экспертная система, встроенная внутрь ядра распознавания, сама выбирает оптимальный для данного текста алгоритм.

Альтернативой традиционному шаблонному методу распознавания стало распознавание на основе принципов целостности, целенаправленности и адаптивности, так называемая IPA-технология, на которой основана система распознавания компании ABBYY - FineReader.

Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственными отношениями. Изображение интерпретируется как определенный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Указанные части получают интерпретацию только в составе гипотезы о предполагаемом объекте.

По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом объекте. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части картинки анализируются не априори, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.

Принцип адаптивности подразумевает способность системы к самообучению.

Именно использование этих основополагающих принципов помогло добиться высочайшего качества распознавания, которое демонстрирует система ABBYY FineReader.

Отдельной задачей является распознавание рукопечатных символов, заключающееся в необходимости распознать символ, несмотря на особенности почерка человека.

Классификатор рынка систем ввода документов

Начале статьи мы упомянули о некоторой терминологической путанице и до сих пор не привели примеров. Дело в том, что упоминаемые выше термины, которые мы ввели при описании технологических процессов, используются также для определения соответствующих секторов рынка и здесь часто имеет место неоднозначность.

Для того чтобы разобраться в терминологии применительно к описанию рынка систем ввода документов, следует отметить, что помимо технологических аспектов, о которых мы говорили выше, существует также специфика, связанная с масштабом использования технологии. Действительно, когда говорят о домашних или о персональных системах ввода документов, то обычно подразумевают именно распознавание неформализованных документов, при незначительном количестве ввода документов за единицу времени. В данном случае на первое место выходит именно технология OCR. Поэтому когда речь идет о рынке OCR, то обычно имеют в виду рынок коробочных программ распознавания неформализованных документов для персонального применения. Напротив, ввод формализованных документов - это технология, которая обычно используется в организациях и имеет массовый характер. В данном случае наряду с распознаванием текстов встает масса технологических проблем - организация поточного сканирования, распределенной обработки, встраивание решения в корпоративные системы документооборота и т.д. Этот сектор обычно называют Document Capture.

В технологическом смысле Document Capture - это комплекс мероприятий по переводу бумажных документов в электронный архив для хранения и обеспечения доступа к ним. А в отношении доли рынка под этим понимают проектный рынок ввода документов, а не коробочные решения. Согласно вышеописанной классификации объем мирового рынка OCR составляет порядка 80 млн. долл. При этом лидером этого рынка является компания ScanSoft, имеющая оборот около 60 млн. долл. Рынок Data Capturing в несколько раз больше - порядка 300 млн. долл. Поскольку рынок Data Capturing является более проектным бизнесом, здесь нет столь явного лидера, как на рынке OCR. Около 50% серьезных контрактов получают четыре крупные компании: Cardiff Software, ReadSoft, Kofax, TIS. Поскольку в проектном бизнесе географическая близость к заказчику имеет чрезвычайно важное значение, выйти на западный рынок российским компаниям весьма сложно. Напротив, говоря о мировом рынке OCR, необходимо отметить выдающиеся успехи отечественной компании ABBYY: доля ее на мировом рынке в последние пять лет постоянно растет. На сегодняшний день компания имеет лучшие по качеству распознавания системы в мире. В 2001 году компания ABBYY оценивала свою долю на мировом рынке OCR в размере 10-12%, а в 2002 году она намеревается выйти на уровень 15 млн., что составит порядка 15-20% мирового рынка. Также ABBYY сейчас активно продвигает свои технологии на мировом рынке ICR - продукт ABBYY FormReader позволяет эффективно обрабатывать большие объемы различных форм: анкет, опросных листов, бланков, заявлений клиентов и т.д. На рынке OCR также активно работает компания Cognitive Technologies, которая в меньшей степени делает упор на рынок коробочного продукта и больше ориентирована на рынок OEM и на проектный отечественный рынок.

Руководство Cognitive Technologies максимальное внимание уделяет вопросам встраивания технологии OCR в интеграционные решения с элементами архивного хранения и обеспечения документооборота. Системами распознавания Cognitive Technologies комплектуется продукция ведущих мировых производителей офисной техники: Hewlett-Packard, Seiko Epson, Canon, Oki, Olivetti. Cognitive Technologies активно развивает направление, связанное с распознаванием форм.

Классификатор International Data Corp (IDC)

Как мы уже отмечали, при оценках объема рынка систем ввода документов встречаются различные подходы. Выше мы привели оценку компании ABBYY, согласно которой объем рынка Document Capture составляет примерно 300 млн. долл. При этом следует иметь в виду, что данная цифра относится к стоимости программного обеспечения. Существуют и другие подходы. В частности, в подходах оценки рынка IDC нет разделения на программную и аппаратную часть, а рассматривается стоимость решения, куда включаются все элементы. Видимо, именно по этой причине оценки мирового рынка имиджинга, по данным IDC, имеют на порядок большие значения (рис. 9).

По методике IDC системы имиджинга и ввода документов рассматриваются как составляющие рынка систем управления документами и бизнес-процессами (рис. 9). Согласно исследованию IDC, эти рынки в год растут примерно на 30% и к концу 2002 года в сумме достигнут 32 млрд. долл.

Cognitive Forms также может обрабатывать различные типы форм в одном потоке и осуществлять автоматическую проверку корректности данных.

В системе реализована уникальная функция Drag&Recog, которая существенно упрощает процедуру распознавания для пользователя. Для этого пользователю нужно лишь с помощью мыши выделить требуемый фрагмент отсканированного документа и перетащить его в поле распознавания.

В программный комплект Cognitive Forms входит отдельный модуль «Дизайнер форм», с помощью которого пользователь сам может создавать формы документов, задавать описания полей и варианты контекстных проверок. Таким образом система позволяет не только обрабатывать формы, но и создавать их.

В новой версии системы, вышедшей в апреле текущего года, реализована возможность единовременной обработки не только бумажных, но и электронных форм документов в форматах HTML и PDF. На сегодняшний день это единственная российская система, позволяющая осуществлять подобную операцию. Это значительно расширяет функциональные возможности системы, разрешая осуществлять сбор и обработку документов как посредством сканирования бумажных копий, так и через Интернет. В настоящее время большая часть корпоративных участников российского рынка перешла на одновременное использование как бумажных, так и электронных форм документов, и поэтому появление подобной системы крайне актуально.

Корпоративная система Cognitive Forms установлена более чем в 400 российских организациях, в числе которых Пенсионный фонд РФ, Газпром, Сбербанк РФ, Газпромбанк. К настоящему моменту с помощью системы было обработано более 100 млн. различных документов.

Продукты для промышленного ввода форм

В этом секторе также можно указать решения на базе вышеописанных технологий CuneiForm и ABBYY FormReader, которые адаптированы для промышленного использования, а также для систем потокового сканирования и распределенной обработки.

Например, система Cognitive Forms, установленная в Пенсионном фонде, ежедневно обрабатывает около 50 тыс. различных документов. При необходимости возможности системы позволяют обрабатывать до миллиона документов в день.

Работа системы включает потоковое сканирование, сортировку и контроль качества изображения, автоматическое распознавание, верификацию, экспорт в базу данных.

Гибридные комплексные решения

В данном секторе можно выделить решение InputAccel компании ActionPoint. Приобретя компанию Captiva, компания ActionPoint получила мощное комплексное решение, включая развитые средства ввода форм. Решение фирмы ActionPoint достаточно широко применяется в мире, однако мало распространено в России. Поэтому охарактеризуем его очень кратко: мощная система для проектов среднего и крупного масштаба, которая обладает соответствующими встроенными средствами разработки, а также средствами поддержки распределенной работы и кластеризации на серверах.

КомпьютерПресс 9"2002

Формализация системы документооборота

Документооборот предприятия – движение документов с момента их создания или получения до завершения исполнения. Под формализацией системы документооборота мы понимаем совокупность мероприятий по оптимизации существующей системы документооборота, разработке единых стандартов к формам документов и описанию их маршрутов, регламентации движения документов и последующему внедрению полученных результатов.

Специалистами нашей фирмы разработана и апробирована методика формализации системы документооборота, позволяющая оптимизировать состав и качество документов, процедуру создания и прохождения документов, максимально эффективно использовать средства компьютерной техники в системе документооборота, с учетом особенностей Вашего предприятия и Ваших предпочтений.

Применение методики при формализации системы документооборота на Вашем предприятии позволит структурировать внешний и внутренний документопоток, оптимизировать внешний вид используемых документов, разграничить ответственность и полномочия лиц, участвующих в подготовке, утверждении и исполнении документов, создать основу для внедрения автоматизированной системы документооборота.

В результате, внедрение системы формализованного документооборота позволит:

1. Контролировать информационные потоки предприятия.

2. Оптимизировать количество циркулирующих на предприятии документов и объем содержащейся в них информации.

3. Повысить качество и скорость работы с документами.

4. Оптимизировать процесс согласования документов.

5. Контролировать прохождение документов по маршрутам (от создания (получения) до исполнения)

6. Систематизировать и оптимизировать документы, участвующие в системе документооборота.

7. Своевременно информировать сотрудников о поступивших (подготовленных) документах.

8. Контролировать исполнительскую дисциплину специалистов, ответственных за подготовку и исполнение документов.

9. Повысить ответственность персонала за работу, связанную с функционированием системы документооборота.

10. Централизованно хранить документы, подготовленные в электронной форме.

Ожидаемым эффектом от внедрения системы формализованного документооборота является:

1. Повышение качества предоставляемой информации и, как следствие, повышение качества принимаемых управленческих решений.

2. Повышение производительности и эффективности выполнения задач, связанных с движением информации.

3. Создание условий и возможностей для совершенствования организационной структуры и управленческих процессов предприятия.

4. Создание основы для качественного сбора данных для управленческого и бухгалтерского учета.

Имиджинг

а первом этапе перевода документа в электронную форму производится его сканирование, которое позволяет получить электронную копию документа в виде изображения. Данный процесс называют имиджингом (imaging). Таким образом, имиджинг - это процесс получения аутентичных изображений бумажных документов. Термин пришел из микрофильмирования, однако сегодня применяется именно к электронным изображениям. Имиджинг является начальным этапом любой системы ввода документов. На этом этапе выполняются задачи сканирования, обработки изображения и контроля качества (рис. 1).

Сканеры позволяют оцифровывать изображения, а также предоставляют ряд дополнительных возможностей, таких как аппаратная поддержка качества изображения и выравнивание страниц.

Выравнивание страниц может производиться как аппаратно, так и программно (рис. 2).

Если речь идет о промышленном вводе документов, то сканеры обычно предоставляют ряд дополнительных функций, например возможность подачи разноформатных документов в одной пачке, а также позволяют использовать большие пачки документов и т.д.

Обработка изображений

Как уже было отмечено, часть функций обработки изображений может быть реализована аппаратно в сканере, а может производиться на станции сканирования. Улучшение изображения включает программное выравнивание, конвертирование с улучшением качества, удаление шумовых и фоновых элементов, улучшение качества передачи текста и т.д.

Наиболее важной технологией на стадии распознавания документов является технология OCR, о которой следует рассказать более подробно.

Технологии OCR/ICR

Традиционный подход к проблеме распознавания заключается в сведении задачи распознавания к задаче классификации некоторого набора признаков. Идея проста: по изображению определяется некоторый набор признаков, который сравнивается с каждым из имеющихся образцов, так называемых эталонов. По результатам сравнения находится эталон, с которым этот набор признаков совпадает лучше всего, и изображение относится к соответствующему классу. Таким образом, все решение заключается в сравнении предлагаемого изображения с образцами и выборе наиболее подходящего; иначе говоря, производится некий перебор возможных вариантов. Проблема имела бы простое решение, если бы не существовало сотен шрифтов, полученных по факсу текстов с плохо читаемыми символами и т.д.

В качестве основных алгоритмов решения данной задачи выделяют multifont (шрифтовые) и omnifont (шрифтонезависимые) алгоритмы. В случае multifont растровое изображение накладывается на шаблон, и соответственно наиболее подходящим шаблоном считается тот, у которого наименьшее количество точек отличается от исследуемого изображения. Omnifont-алгоритмы идентифицируют символ по правилам его написания. В этом случае эталон, с которым производится сравнение, содержит в себе информацию о правилах написания символа. Оба алгоритма имеют вероятностную природу и позволяют сделать предположение о принадлежности данного символа. Основная задача при распознавании текстов - это повышение вероятности принятия правильного решения, то есть уменьшение доли ошибок. Существует несколько подходов к повышению качества распознавания. Например, алгоритм может содержать комбинацию шрифтового и шрифтонезависимого подхода. Существенное увеличение точности распознавания достигается за счет использования самообучения системы. Это позволяет, например, распознавать плохо пропечатанные символы с помощью шрифта, созданного на основе достаточно хорошо пропечатанных символов. Следует отметить, что на текстах хорошего качества лучше работают одни алгоритмы, на текстах плохого качества - другие, а для распознавания табличных форм удобнее использовать третьи и т.д. Существуют подходы, при которых экспертная система, встроенная внутрь ядра распознавания, сама выбирает оптимальный для данного текста алгоритм.

Альтернативой традиционному шаблонному методу распознавания стало распознавание на основе принципов целостности, целенаправленности и адаптивности, так называемая IPA-технология, на которой основана система распознавания компании ABBYY - FineReader.

Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственными отношениями. Изображение интерпретируется как определенный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Указанные части получают интерпретацию только в составе гипотезы о предполагаемом объекте.

По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом объекте. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части картинки анализируются не априори, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.

Принцип адаптивности подразумевает способность системы к самообучению.

Именно использование этих основополагающих принципов помогло добиться высочайшего качества распознавания, которое демонстрирует система ABBYY FineReader.

Отдельной задачей является распознавание рукопечатных символов, заключающееся в необходимости распознать символ, несмотря на особенности почерка человека.

Классификатор рынка систем ввода документов

Начале статьи мы упомянули о некоторой терминологической путанице и до сих пор не привели примеров. Дело в том, что упоминаемые выше термины, которые мы ввели при описании технологических процессов, используются также для определения соответствующих секторов рынка и здесь часто имеет место неоднозначность.

Для того чтобы разобраться в терминологии применительно к описанию рынка систем ввода документов, следует отметить, что помимо технологических аспектов, о которых мы говорили выше, существует также специфика, связанная с масштабом использования технологии. Действительно, когда говорят о домашних или о персональных системах ввода документов, то обычно подразумевают именно распознавание неформализованных документов, при незначительном количестве ввода документов за единицу времени. В данном случае на первое место выходит именно технология OCR. Поэтому когда речь идет о рынке OCR, то обычно имеют в виду рынок коробочных программ распознавания неформализованных документов для персонального применения. Напротив, ввод формализованных документов - это технология, которая обычно используется в организациях и имеет массовый характер. В данном случае наряду с распознаванием текстов встает масса технологических проблем - организация поточного сканирования, распределенной обработки, встраивание решения в корпоративные системы документооборота и т.д. Этот сектор обычно называют Document Capture.

В технологическом смысле Document Capture - это комплекс мероприятий по переводу бумажных документов в электронный архив для хранения и обеспечения доступа к ним. А в отношении доли рынка под этим понимают проектный рынок ввода документов, а не коробочные решения. Согласно вышеописанной классификации объем мирового рынка OCR составляет порядка 80 млн. долл. При этом лидером этого рынка является компания ScanSoft, имеющая оборот около 60 млн. долл. Рынок Data Capturing в несколько раз больше - порядка 300 млн. долл. Поскольку рынок Data Capturing является более проектным бизнесом, здесь нет столь явного лидера, как на рынке OCR. Около 50% серьезных контрактов получают четыре крупные компании: Cardiff Software, ReadSoft, Kofax, TIS. Поскольку в проектном бизнесе географическая близость к заказчику имеет чрезвычайно важное значение, выйти на западный рынок российским компаниям весьма сложно. Напротив, говоря о мировом рынке OCR, необходимо отметить выдающиеся успехи отечественной компании ABBYY: доля ее на мировом рынке в последние пять лет постоянно растет. На сегодняшний день компания имеет лучшие по качеству распознавания системы в мире. В 2001 году компания ABBYY оценивала свою долю на мировом рынке OCR в размере 10-12%, а в 2002 году она намеревается выйти на уровень 15 млн., что составит порядка 15-20% мирового рынка. Также ABBYY сейчас активно продвигает свои технологии на мировом рынке ICR - продукт ABBYY FormReader позволяет эффективно обрабатывать большие объемы различных форм: анкет, опросных листов, бланков, заявлений клиентов и т.д. На рынке OCR также активно работает компания Cognitive Technologies, которая в меньшей степени делает упор на рынок коробочного продукта и больше ориентирована на рынок OEM и на проектный отечественный рынок.

Руководство Cognitive Technologies максимальное внимание уделяет вопросам встраивания технологии OCR в интеграционные решения с элементами архивного хранения и обеспечения документооборота. Системами распознавания Cognitive Technologies комплектуется продукция ведущих мировых производителей офисной техники: Hewlett-Packard, Seiko Epson, Canon, Oki, Olivetti. Cognitive Technologies активно развивает направление, связанное с распознаванием форм.

Классификатор International Data Corp (IDC)

Как мы уже отмечали, при оценках объема рынка систем ввода документов встречаются различные подходы. Выше мы привели оценку компании ABBYY, согласно которой объем рынка Document Capture составляет примерно 300 млн. долл. При этом следует иметь в виду, что данная цифра относится к стоимости программного обеспечения. Существуют и другие подходы. В частности, в подходах оценки рынка IDC нет разделения на программную и аппаратную часть, а рассматривается стоимость решения, куда включаются все элементы. Видимо, именно по этой причине оценки мирового рынка имиджинга, по данным IDC, имеют на порядок большие значения (рис. 9).

По методике IDC системы имиджинга и ввода документов рассматриваются как составляющие рынка систем управления документами и бизнес-процессами (рис. 9). Согласно исследованию IDC, эти рынки в год растут примерно на 30% и к концу 2002 года в сумме достигнут 32 млрд. долл.

Cognitive Forms также может обрабатывать различные типы форм в одном потоке и осуществлять автоматическую проверку корректности данных.

В системе реализована уникальная функция Drag&Recog, которая существенно упрощает процедуру распознавания для пользователя. Для этого пользователю нужно лишь с помощью мыши выделить требуемый фрагмент отсканированного документа и перетащить его в поле распознавания.

В программный комплект Cognitive Forms входит отдельный модуль «Дизайнер форм», с помощью которого пользователь сам может создавать формы документов, задавать описания полей и варианты контекстных проверок. Таким образом система позволяет не только обрабатывать формы, но и создавать их.

В новой версии системы, вышедшей в апреле текущего года, реализована возможность единовременной обработки не только бумажных, но и электронных форм документов в форматах HTML и PDF. На сегодняшний день это единственная российская система, позволяющая осуществлять подобную операцию. Это значительно расширяет функциональные возможности системы, разрешая осуществлять сбор и обработку документов как посредством сканирования бумажных копий, так и через Интернет. В настоящее время большая часть корпоративных участников российского рынка перешла на одновременное использование как бумажных, так и электронных форм документов, и поэтому появление подобной системы крайне актуально.

Корпоративная система Cognitive Forms установлена более чем в 400 российских организациях, в числе которых Пенсионный фонд РФ, Газпром, Сбербанк РФ, Газпромбанк. К настоящему моменту с помощью системы было обработано более 100 млн. различных документов.

Продукты для промышленного ввода форм

В этом секторе также можно указать решения на базе вышеописанных технологий CuneiForm и ABBYY FormReader, которые адаптированы для промышленного использования, а также для систем потокового сканирования и распределенной обработки.

Например, система Cognitive Forms, установленная в Пенсионном фонде, ежедневно обрабатывает около 50 тыс. различных документов. При необходимости возможности системы позволяют обрабатывать до миллиона документов в день.

Работа системы включает потоковое сканирование, сортировку и контроль качества изображения, автоматическое распознавание, верификацию, экспорт в базу данных.

Гибридные комплексные решения

В данном секторе можно выделить решение InputAccel компании ActionPoint. Приобретя компанию Captiva, компания ActionPoint получила мощное комплексное решение, включая развитые средства ввода форм. Решение фирмы ActionPoint достаточно широко применяется в мире, однако мало распространено в России. Поэтому охарактеризуем его очень кратко: мощная система для проектов среднего и крупного масштаба, которая обладает соответствующими встроенными средствами разработки, а также средствами поддержки распределенной работы и кластеризации на серверах.

КомпьютерПресс 9"2002

Формализованные документы - это документы, в которых заранее определена форма: расположение обязательных полей. Формализованными документами являются различные бланки, накладные и т.п. Обычные документы - это документы произвольной формы: договора, письма и т.д. Для работы в системе ЭД2 программистам пришлось разработать формализованный вид и для обычных документов. В специализированной программе декларант формирует электронную декларацию на товары (ЭДТ) и комплект необходимых формализованных документов (комплект документов, переведенных в XML-формат). При подготовке документов для представления в таможенные органы учитываются особенности и ограничения, накладываемые требованиями актуальной версии Альбома форматов электронных документов .

До рассмотрения темы формализации документов следует сказать, что без создания основного листа ДТ начать работу по формализации документов невозможно.

Создание декларации (основного и дополнительных листов ДТ, ДТС) c чистого листа.

В программе СТМ «ВЭД-Декларант» выбираем инструмент «создать новую ДТ»

В результате получаем основное окно программы ВЭД-Декларант с развернутой ДТ – основной лист.

Разработчики программы постарались максимально точно сохранить алгоритм заполнения ДТ при перемещении по графам в процессе их заполнения. Некоторые графы ДТ имеют сложную структуру — внешне они выглядят как набранный построчно текст, но на самом деле представляют собой сложную таблицу. Для их заполнения необходимо нажимать функциональные клавиши, которые описаны в подсказках в нижней строке программы ВЭД-Декларант.

С 01.07.15 изменения коснулись не только форматов обмена, но и комплекта документов, передаваемых вместе с ДТ, правил заполнения графы 44 ДТ. Так, из первичного комплекта документов исключена опись, а перечень документов, прилагаемых к ДТ, перечисляется в графе 44. Эти правила вводит решение Коллегии ЕЭК № 98 от 02 июля 2014 года «Об Инструкции о порядке регистрации или отказа в регистрации декларации на товары». Новое решение заменяет ранее действовавшую Инструкцию № 262 от 20 мая 2010 года.

Согласно новому решению, опись с ДТ не передается. Т.е. сведения о документах, на основании которых заполнена ДТ, указываются в графе 44. Для этого:

В гр. 44 заполняем документы

    Создаём опись (опись остаётся как внутренний документ ВЭД Декларанта, передаваться не будет).

В то же время опись, в соответствии с действующим законодательством, продолжает существовать как бумажный документ, поэтому пока нельзя закрывать возможность ее оформления и печати.

В этих условиях опись, используется как вспомогательный список, содержащий сводную информацию по документам, заявленным в ДТ, в том числе и технического характера.

Чтобы исключить лишнюю работу по подготовке документов и избежать недоразумений на этапе обмена данными, разработчики рекомендуют свести оформление описи к минимуму .

Формируем опись только автоматически, включив в неё только документы графы 44.
Далее переходим в раздел «Работа с электронными документами». Подготавливаем формализованные документы, предварительно разместив в архиве декларанта и прикрепляем к ДТ. Для формализованных документов, в части окна архивы РТУ добавлен новый статус, красный шарик, он означает что документ размещен в архиве, созданном до 1 июля 2015 г. Внешний вид рабочего окна «Подготовка документов для передачи в систему ЭД» программы ВЭД- Декларант.


В верхней части окна расположена таблица с перечнем документов, как описанных в графе 44 данной декларации, так и когда либо с ней использовавшихся в случае, если декларация создавалась по образцу. Документы, которые скопировались с предыдущей декларации, выделенны серым цветом. Функцию копирования документов для системы ЭД можно отключить при создании декларации.

В колонке «размещение» указан признак того, находится или нет данный документ в ЭАДД. Признак представляет собой шарик разного цвета – желтый означает что документ подготовлен но не размещен в архиве ЦТУ. Зелёный цвет — означает что документ готов и размещен в архиве ЦТУ. Колонка «в гр 44» показывает нам что документ есть в графе 44 ДТ основного листа или доп листов и ссылка на него исправна. Колонка «готов» работает вместе с кнопкой с синей стрелочкой и цветом строки. Первоначально, цвет строки белый, это значит что документ еще не создан. Для создания документа надо нажать на кнопку с синей стрелкой и выбрать нужный документ из выпадающего списка. До 01.07.15 у документов в гр 44. был отдельный справочник и пользователь выбирал код документа отдельно для графы 44 и для описи. Галочка «только документы разрешенные для кода ХХХХ» означает, что при выборе документа его код будет соответсвовать классификатору. Соответсвие кодов формализованных документов с 01.07.15 задается специальным документом спецификации — ТАБЛИЦА СООТВЕТСТВИЯ ДОКУМЕНТОВ АЛЬБОМА ФОРМАТОВ КЛАССИФИКАТОРУ ВИДОВ ДОКУМЕНТОВ, ИСПОЛЬЗУЕМЫХ ПРИ ЗАЯВЛЕНИИ СВЕДЕНИЙ В ГРАФЕ 44 ДТ ПРИЛОЖЕНИЕ А2 Версия 3.3.6
При снятии галочки «только документы разрешенные для кода ХХХХХ» декларация не пройдет автоматический ФЛК.


    Если необходимо будет в первичном наборе документов передать Доверенность и/или Договор таможенного брокера с декларантом вам необходимо их прикрепить к текущей ДТ (серые документы в верхней части окна)

Все прочие документы , включая:

— регистрационные документы предприятия;

— представительские и прочие договоры;

— документы, подтверждающие таможенную стоимость;

— иные документы, могут предоставляться только по запросу инспектора .

После получения запроса инспектора необходимо:

    Подготовить документ

    Разместить его в электронном архиве декларанта.

Пока инспектор запрос не прислал, никакой дополнительный документ не может быть ему предоставлен. Если есть необходимость добавить какой-то документ в графу 44, это можно сделать только через КДТ.

В новой спецификации изменен перечень формализованных документов

Поскольку опись не подаётся, не может быть использован для документа код «00000». Допустимо использование только тех кодов видов документов, которые фигурируют в классификаторе графы 44. Это описано в Приложении А2 Спецификации взаимодействия. Соответствие кодов и типов документов.

Вносится изменение в заполнение графы 44. Эти изменения описаны в Решении Коллегии ЕЭК № 127 от 18 июля 2014 года «О внесении изменений в Инструкцию о порядке заполнения декларации на товары»

Теперь для каждого документа, внесенного в графу, добавляется признак, подтверждающий представление либо непредставление документа при подаче ДТ.

Этот признак – числа от 0 до 4. Каждое число, описывает определенное состояние документа.


«0» — документ не представлен при подаче ДТ;

«1» — документ представлен при подаче ДТ;

«2» — документ не представлен в соответствии с частью второй пункта 4 статьи 183 Кодекса. В этом случае после проставления признака через пробел указываются номер и дата документа и далее через пробел — регистрационный номер ДТ или иного таможенного документа, к которому был приложен этот документ.

«3» — документ представлен (будет представлен) после выпуска товаров. В данном случае, если законодательством государств — членов Таможенного союза предусмотрена возможность представления отдельных документов после выпуска товаров, после проставления признака через пробел производится запись об обязательстве декларанта представить недостающие документы с указанием даты.

Внешний вид ДТ с заполненной графой 44

Внешний вид графы 44, при нажатии специальной клавиши, которая раскрывает внутреннее содержимое этой графы.

Теперь после всех подготовительных мероприятий можно приступать к непосредственной формализации документов.

В зависимости от сложности документа окно формализованного вида документа разбито на вкладки, в которых объединена сходная по тематике информация. В начале развития технологии ЭД2 в формализованных документах могли быть заполнены только ключевые поля. Они были обведены красной рамкой. Остальная информация не передавалась. Сейчас согласно действующим форматам обмена передаются все поля, и поэтому требуется максимальное заполнение документа. Проверку на правильность заполнения документа можно быстро провести, находясь в этом окне, кнопкой с изображением галочки.

Работа с архивом электронных документов декларанта ЭАДД

Электронный архив декларанта

Электронный архив декларанта (ЭАД) – это удалённое хранилище.xml-документов на сервере таможни.

Работа с ЭАД регламентируется спецификацией, разработанной ЦИТТУ ФТС России.

Электронные архивы могут создаваться разными лицами для разных региональных таможенных управлений (РТУ) независимо. Это означает, что:

1. Если планируется работа нескольких декларантов с использованием документов из одного и того же архива, то в Настройках программы, в разделе ЭПС, в настройках текущего профиля необходимо проверить, совпадают ли значения Идентификатора участника (выдаётся таможней для каждого юридического лица) и Кода регионального управления (в формате NNN00000, например 10100000 для ЦТУ, 10200000 для СЗТУ и т.д.). Важно: если будет расхождение в том или другом параметре, то фактически это будет означать работу с разными архивами.


Работа с документами в электронном архиве

Участник ВЭД может хранить на сервере РТУ произвольное количество архивов с произвольным количеством документов в каждом.

Документ может находиться в следующих статусных состояниях:

1. документ не использовался, актуален (срок действия не истёк);

2. документ не использовался, просрочен (истёк срок действия);

3. документ использовался, актуальный (срок действия не истёк);

4. документ использовался, просрочен (истёк срок действия).

Документы с 3 и 4 статусом НЕ могут быть изменены или удалены из Электронного архива!

Для размещения формализованных документов в архивах РТУ нажмите кнопку «Добавить в архив». Выберите из списка необходимый архив или добавьте новый.


Добавление нового архива

Для более детальных операций с архивами и/или документами в архиве нажмите ссылку «Архивы РТУ»

В этом окне вы можете просмотреть все созданные архивы и документы в них. В меню по правой клавише мыши доступны дополнительные функции, например удаление архива и удаление документов в архиве.

В случае, если удалить документ из архива нельзя, и при этом вы не планируете архив использовать, от него можно отключиться. При этом документ остается в рабочей базе данных. Точно также вы можете отключаться полностью от архива РТУ. При этом вы можете изменить документ, даже если вы от него отключились, и разместить его в новом архиве.

При работе с электронным архивом необходимо помнить, что актуальная версия архивов и документов в них хранится на сервере таможни. Поэтому, например, чтобы увидеть изменения в архиве, внесённые Вашими коллегами, необходимо получить эту версию с удалённого сервера.

Важно:
как и при работе в рамках электронного декларирования, вся работа с электронным архивом может осуществляться при наличии действующей ЭЦП, так как все сообщения должны быть подписаны цифровой подписью. Все ответы в рамках работы с ЭАД формируются транспортной системой автоматически, без участия инспектора.

Запрос списка архивов

Для получения актуального на настоящий момент списка архивов, необходимо выполнить запрос к удалённого серверу. Для этого по правой кнопке мыши в окне архивов выберите кнопку Запросить список. В итоге будет отправлено служебное сообщение, и после получения ответа в окне появится актуальный список архивов.

Создание и удаление архивов

Для добавления нового архива нажмите кнопку «Создать», укажите желаемое имя архива и нажмите ОК.

Будет отправлен запрос на создание, и после получения разрешения от транспортной системы архив будет создан на удалённом сервере (в списке статус будет статус «Архив создан»).

Для удаления архива выберите нужный архив в списке и нажмите кнопку «Удалить». В случае успеха статус архива сменится на «Архив удалён».

Важно:
удалить можно только архив, не содержащий ни одного документа!

Запрос списка документов

Для получения актуального списка документов в текущем архиве необходимо выполнить запрос. Для этого в окне списка документов выберите кнопку «Запросить список». После ответа транспортной системы на запрос в окне появится актуальный на текущий момент список.

Двойным щелчком по конкретному документу можно зайти внутрь для просмотра его содержания. Если у вас нет этого документа, то следует выполнить запрос копии документа.

Запрос копии документа из архива

Версия.xml-документа, имеющаяся у Вас, может не совпадать с той, которая хранится в электронном архиве. Для того, чтобы получить актуальную копию документа, необходимо в списке документов архива выбрать конкретную позицию и нажать кнопку «Запросить». Транспортная система вернёт в ответ актуальную на текущий момент копию документа.

Об электронном документообороте говорят часто и много, но ориентироваться в большом количестве новых терминов сложно, а еще сложнее понять, как все это работает. Серия статей «Бухгалтер и электронный документ» разработана специально для того, чтобы на доступном языке рассказать об этом виде взаимодействия все, что нужно знать бухгалтеру. Как начать обмен? Как работать с первичкой и сдавать отчетность в электронном виде? На эти и другие вопросы вы найдете ответ в наших выпусках.

В прошлых главах мы уже рассмотрели целый ряд интересных вопросов, связанных с электронным документооборотом: и . В новой главе мы расскажем вам об основе документооборота - электронном документе. Несмотря на кажущуюся простоту понятия, документы в электронном виде вызывают ничуть не меньше, а то и больше вопросов у бухгалтеров. Сегодня мы обсудим ключевые первичные документы, которые уже прямо сейчас можно использовать в цифровом виде, расскажем о том, что стоит знать о формах и форматах, и какими нормативными актами это урегулировано.

Электронный документ и юридическая сила

Как мы и говорили, документ - это основополагающее понятие в документообороте. Определение электронного документа содержится в ст. 2 ФЗ 149: электронный документ - документированная информация, представленная в электронной форме, то есть в виде, пригодном для восприятия человеком с использованием электронных вычислительных машин, а также для передачи по информационно-телекоммуникационным сетям или обработки в информационных системах.

Электронный документ, подписанный электронной подписью, может применяться в любых правоотношениях, если законодательство РФ не содержит прямого запрета на их использование. Таким образом, договоры, различные счета, заявки, отчеты, заявления, а также товарные накладные, акты и даже счета-фактуры могут быть электронными.

Кстати, многие считают (и не без оснований), что юридическую силу электронному документу придает именно электронная подпись. Однако сама по себе ЭП является лишь частью целого ряда мероприятий по обеспечению документов юридической силой. Что-то вы можете сделать самостоятельно, например, обеспечить соответствие форматам, а часть - только с помощью специалистов.

Из схемы видно, что для разных документов существуют разные гаранты юридической силы. Например, неформализованные документы - письма, договора, доверенности, техническая документация и другая корреспонденция - свободны от жесткого регулирования со стороны государства. Поэтому их юридическая сила определяется соглашением об обмене, в котором могут быть прописаны все требования к реквизитам, форме и формату, и наличием электронной подписи, не обязательно квалифицированной.

При наличии соответствующих корпоративных нормативов простой электронной подписью можно считать введение пары логин-пароль во внутренней системе электронного документооборота. Каждый внутренний документ фактически подписывается: система вас узнает по логину-паролю, фиксирует время и авторство подписи, когда вы осуществляете нажатие определенной кнопки, которое в свою очередь заносится в лог - специальный внутренний протокол событий в информационной системе. Следовательно, внутренний электронный документ автоматически становится юридически сильным и может использоваться при различных разбирательствах.

Другое дело, когда речь идет о формализованных документах. Эти документы называются формализованными именно потому, что для них в отдельных законодательных актах прописаны жесткие требования к формату и регламенту передачи. Эти документы напрямую влияют на правильность налоговых расчетов, поэтому соблюдение всех процедур передачи для них критически важно.

Формат и форма

Уже неоднократно в этой статье упоминалось слово «формат». Часто бухгалтеры путают формат и форму документа. В понимании оператора ЭДО (провайдера электронного документооборота) формализованный документ - документ, созданный по формату ФНС. Фактически, это структурированный набор данных, который можно визуально отобразить в любой форме. А форма - это то, как зрительно документ должен выглядеть, то есть, по сути, его печатная форма.

Форма счета-фактуры определяется в законе ФЗ 402 «О бухгалтерском учете», формат отдельным приказом ФНС.

Когда говорим о форматах и формах, мы всегда четко расставляем понятия. Формат - это контейнер для информации, а форма - ее визуальное отражение.

А теперь, когда основополагающие понятия мы рассмотрели, давайте кратко рассмотрим основные формализованные документы в ЭДО.

Электронные счета-фактуры

Счет-фактура - один из важнейших документов в работе бухгалтера. Не смотря на то, что электронные счета-фактуры неотличимы от бумажных аналогов, при работе с ними возникает множество вопросов.

Работа с электронным счетом-фактурой жестко регламентирована. Процедура отправки и получения электронных счетов-фактур через оператора ЭДО прописана в Приказе Минфина от 25.04.2011 №50н «Об утверждении порядка выставления счетов-фактур в электронном виде по ТКС». Данный приказ предусматривает обязательность использования оператора ЭДО в случае необходимости выставления счетов-фактур в электронном виде с обеспечением юридической значимости.

Также приказ Минфина РФ предусматривает создание участниками ЭДО, в том числе оператором ЭДО, служебных документов, которые фактически являются подтверждением получения документа участником ЭДО. В этих документах и скрыта вся суть регламента обмена: по факту, это самостоятельные.xml-файлы, которые пользователям не видны, но играют важную роль в обеспечении юридической значимости обмена счетами-фактурами.

Анастасия Щепина, аналитик Synerdocs

Если в электронном счете-фактуре обнаружена ошибка, то продавец может создать исправленный или корректировочный счет-фактуру. Процесс аналогичен работе с бумажными документами, просто в электронном виде все происходит проще и быстрее. Сообщение об ошибке вам отправляет контрагент после ее обнаружения, соответственно, вы сможете оперативно подготовить исправленный или корректировочный документ.

Книги покупок и книги продаж

Сегодня в законодательстве РФ нет прямых указаний, обязывающих переводить журнал полученных и выставленных счетов-фактур и книги покупок/продаж в электронный вид при наличии ЭДО. Однако некоторые эксперты рекомендуют уже сейчас переводить книги в электронный вид.

Правила ведения едины и для электронных, и для бумажных журналов и книг. Согласно Приложению 3 к Постановлению Правительства РФ от 26.12.2011 N 1137 журнал полученных и выставленных счетов-фактур необходимо вести за каждый налоговый период. Электронный журнал должен быть подписан электронной подписью при передаче в контролирующие органы.

Книги покупок, продаж и дополнительные листы к ним, составленные в электронном виде за налоговый период, подписываются электронной подписью руководителя организации (уполномоченного им лица) или ИП при их передаче в налоговый орган в случаях, предусмотренных Налоговым кодексом РФ.

Электронные товарные накладные и акты

Существуют рекомендованные ФНС форматы товарной накладной и акта выполненных работ, утвержденные Приказом ФНС РФ от 21.03.2012 N ММВ-7-6 172@ «Об утверждении форматов первичных учетных документов (ТОРГ-12 и акт)». Само слово «рекомендованные» говорит о том, что данные форматы, по сути, не являются обязательными.

При внедрении электронного документооборота мы в первую очередь советуем пользоваться рекомендованным форматом. Так формализованный документ будет проще обрабатывать, искать и представлять в электронном виде в ФНС.

Но если же вы с контрагентами работаете с очень специфичными актами со множеством дополнительных данных и вам будет неудобно использовать формализованный акт приемки-сдачи работ (услуг), то можете и дальше отправлять документы по привычной вам форме. Формат при этом может быть любым: .PDF, .DOC, .XLS, .JPEG, .TIFF и так далее.

Анастасия Щепина, аналитик Synerdocs

Если налоговые органы потребуют акты и накладные для проверки, то способ их представления будет зависеть от того, в каком виде были составлены эти документы.

Универсальный передаточный документ в электронном виде

Фактически универсальный передаточный документ (УПД) - это счет-фактура с дополнительными полями. Но для счета-фактуры жестко установлен формат, и использовать какой-то другой мы не можем, поэтому вариант с созданием электронного УПД на его основе отпадает. Мы не знаем, как такой документ воспримет ФНС, и как организовать работу с его подписанием.

Также следует учитывать, что в законодательстве нет порядка обмена УПД. Есть порядок обмена электронными счетами-фактурами. Официально ни в каком источнике не сказано, что электронными УПД нужно обмениваться по регламенту ЭСФ и использовать их же формат. Насколько нам известно, сегодня никто не обменивается УПД в электронном виде.

Отвечая на вопросы про УПД, мы всегда стараемся понять, а почему бухгалтеры вообще пользуются этим документом. Его основная цель - снизить объем документооборота, сделать его универсальным, из двух документов сделать один. При переходе на электронный документооборот налогоплательщик автоматически решает задачу оптимизации ресурсов. Получается, что объективные преимущества, которые дает применение УПД в бумажном виде, совершенно не актуальны для электронного документооборота.

Анастасия Щепина, аналитик Synerdocs

Вместо заключения

Как видите, самые важные документы вполне себе живут в электронном виде. Да, многое завязано на непривычных технических нюансах, некоторым бухгалтерам придется привыкать к новым требованиям. Эффективней всего в электронном виде реализована работа с счетами-фактурами и актами, здесь наиболее проработанные процессы, прозрачный регламент и требования. Объяснить это просто: эти документы напрямую участвуют в налоговом администрировании, то есть, замешаны на процессах поступления налогов в казну. Другие документы вызывают меньше вопросов у государства, а, значит, к ним предъявляется меньше требований.

Мы намеренно взяли в обзор только те документы, с которыми чаще всего работают именно бухгалтеры. Если бы мы добавили к этому списку неформализованные документы, договоры, свидетельства, доверенности - то пришлось бы писать две главы.

В следующей главе

В четвертой главе «Бухгалтер и электронный документ» вы узнаете о том, как ЭДО позволит вам эффективно взаимодействовать с ФНС, решать проблемы еще до их возникновения и минимизировать число визитов налоговых инспекторов в вашу организацию.

Просмотров