SPIRIT подал заявку на патент технологии сжатия данных

Москва, 4 октября 2016 г. Российская компания SPIRIT, №1 в мире в области разработки и лицензирования программных движков для передачи голоса и видео по IP-сетям, разработчик ВКС сервера VideoMost, сообщила о том, что подала заявку на получение патента на технологию супер-сжатия мультимедийной информации (видео и голоса) большого объема для хранения в системах хранения данных (СХД).

Сегодня, в связи с принятием пакета законов Яровой, резко возрос интерес отечественных операторов связи к технологиям эффективного сжатия и хранения данных в компактном виде, которые бы позволили существенно экономить ресурсы СХД. В прессе фигурируют космические цифры стоимости ЦОДов, которые необходимы для реализации Закона. Однако все эти расчеты сделаны для стандартных протоколов связи и кодирования голоса и видео. SPIRIT более 20 лет занимается реализацией различных методов кодирования видео и речи, и в отечественном разработчике решили подойти к решению проблемы креативно и инновационно.

Видео сегодня занимает более 70% пропускной способности мировых телеком сетей.

Запись и последующее декодирование качественного, разборчивого голоса критически важны для исполнения закона Яровой, для последующего анализа и поиска в записанной речи программными средствами или человеком.

Сжатие речи. Популярные международные стандарты ITU-T для операторов связи – голосовые кодеки G.729, G.723.1 сжимают речь примерно в 8 раз (с потерями), после этого SPIRIT может сжать речь еще в 3 раза. Один из высокоэффективных специализированных кодеков для записи речи SPIRIT VoStoC (Voice Storage Codec) уже прошел обкатку и временем и клиентами.

SPIRIT VoSToC - это специализированный высокоэффективный вокодер, работающий на скорости 2400 бит/с и спроектированный специально для хранения речи. По качеству воспроизведения речи VoSToC в своем классе превосходит мировые аналоги. «Когда заходит речь о поиске лучшего решения для хранения большого объема мультимедийных данных, необходимо уделять внимание двум основным параметрам: степени сжатия и качеству записанной речи», — поясняет Владимир Свириденко, технический директор SPIRIT. — У нас разработаны и уже используются на мировом рынке технологии сжатия голоса, которые позволяют записать в 1 МБ памяти почти 2 часа вокодированной речи».

Сжатие видео. Популярные международные стандарты ITU-T для операторов связи и ВКС-вендоров – видео кодеки H.263/H.264 сжимают видео в среднем примерно в 50 раз (с потерями), после этого SPIRIT может сжать видео еще в 100 раз, путем интеллектуального анализа информации на основе ее важности.

«Закон требует записывать и хранить все мультимедийные данные, и, если текст не занимает много места в СХД, то для хранения речи, аудио и видео, потребуются на порядки большие ресурсы. Нет надобности хранить весь “информационный мусор”, бо́лее компактно можно записать малоинформативную часть данных, а вот все самые важные фрагменты записи должны быть представлены качественно» - комментирует профессор, д.т.н. Владимир Свириденко, технический директор SPIRIT, и автор патентной завяки.

В патентной заявке значится, что изобретение относится к области сжатия, передачи и хранения в компактном виде мультимедийной информации, циркулирующей в системах передачи/записи видео, изображений, речевых/аудио потоков, графических и текстовых файлов, включая системы речевой связи, видеоконференции, видеонаблюдение, системы хранения данных, а также поисковые системы.

Предложенная концепция интеграции интеллектуальной классификации разных фрагментов мультимедийной информации и известных методов кодирования источника с потерями, разработанная SPIRIT, позволяет минимум на порядок повысить эффективность компактного представления мультимедийной информации по сравнению с традиционными методами сжатия изображений, видео, речевых сообщений и аудио сигналов и позволяет конструктивно ответить на вопросы мета-уровня: что хранить, как и в каком формате, как определить ценность хранимой информации для системы принятия решения, как ее закодировать и записать в цифровую память.

Технические детали

Для кодирования видео широко используются кодеки ITU-T Н.26Х, а также проприетарные кодеки VPх. Коэффициент сжатия варьируется от 10 до 500 раз в зависимости от допустимой скорости видеопотока или выделенного объема памяти для хранения изображений/видео, уровня заданного качества, типа кодека и специфики изображений/видео. Широко используемый в таких кодеках принцип сжатия изображений и видео с потерями – это устранение пространственной избыточности на базе перехода из пространственной области в частотную на базе трансформации матрицы изображения, как в JPEG (или опорного кадра, как в MPEG 2 и 4) и использования системы ортогональных функций (преобразование Фурье, Уолша, дискретного косинусного преобразования (DCT), вейвлетов и др.) и тонкого или грубого квантования компонент, что вносит погрешность, и последующее кодирование квантованных компонент на принципах энтропийного кодирования без потерь (в частности, арифметического кодирования); устранение временной избыточности в соседних кадрах видеопотока, в которых, как правило, есть небольшие изменения за счет движения объектов в кадре или видеокамеры, выявляемые оценивателем движения (motion estimator) и определением векторов движения для кодирования только измененных фрагментов нового кадра по отношению к опорному (что детально описано в стандартах MPEG 2 и 4, Н.26х).

Для кодирования речи используются речевые кодеки по стандартам ITU-T серии G.7xx (G.711, G.718, G.719, G.722.2 (AMR WB), G.723.1, G.726, G.729, G.729.1 и др.), кодеки GSM, SILC, iLBC и другие проприетарные кодеки. Коэффициент сжатия варьируется от 5 до 50 раз в зависимости от требуемой скорости речевого потока на выходе кодера, уровня заданного качества, допустимой задержки и специфики речевого сигнала (с учетом пауз в речи). Если же форма оригинального сигнала сохраняется на выходе кодека с контролируемой погрешностью, то такие кодеки называются кодеками речевой волны (waveform codecs).

Для кодирования аудио-сигналов используются такие известные и широкоиспользуемые аудио-кодеки как МР3, ААС, ААС+, WMA и др. Практически все аудио-кодеки построены на основе метода waveform coding, но обработка сигнала производится, как правило, в частотной области. Коэффициент сжатия аудиопотока варьируется от 5 до 30 раз и зависит от полосы частот аудио-сигнала и требуемого качества воспроизведения аудио при декодировании.

О компании SPIRIT

Компания SPIRIT — №1 в мире в области разработки и лицензирования программных движков для передачи голоса и видео по IP-сетям. Инновационная коммуникационная программная платформа операторского класса SPIRIT используется операторами связи, производителями оборудования, разработчиками программного обеспечения и веб-сервисов и обслуживает свыше миллиарда пользователей более чем в 100 странах мира, больше чем Skype. Программные продукты SPIRIT лицензированы и/или стоят внутри популярных потребительских продуктов Apple, Adobe, ARM, AT&T, Avaya, Blizzard, BroadSoft, BT, China Mobile, Dialogic, Ericsson, HP, HTC, Huawei, Korea Telecom, Kyocera, LG U+, Mitel, Microsoft, NEC, Oracle, Polycom, Reliance, Samsung, Skype, Texas Instruments, Toshiba, Viber, ZTE и более 250 других мировых технологических лидеров. Прямые клиенты SPIRIT сегодня являются производителями более 60% смартфонов в мире.

VideoMost® - программный продукт российской компании SPIRIT для проведения многоточечных видеоконференций на ПК, Mac, планшетах и смартфонах для корпоративных клиентов. Клиенты продукта SPIRIT VideoMost® для видеоконференций в России и СНГ – сотни государственных и частных организаций, включая банки, школы и ВУЗы, медучреждения и предприятия. Более подробную информацию о продукте можно найти на сайте www.videomost.com

Поделитесь статьей в социальных сетях:

Наши продукты

img
VideoMost Server
Сервер видеоконференций для установки в инфраструктуре организации
img
VideoMost SaaS
Облачный ВКС сервис бесплатно
на 3 месяца
img
TeamSpirit IM
Корпоративный мобильный мессенджер c
видеоконференциями