Iterative Adaptation to Quantization Noise

Результат исследования: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

Аннотация

Quantization allows accelerating neural networks significantly, especially for mobile processors. Existing quantization methods require either training neural network from scratch or gives significant accuracy drop for the quantized model. Low bits quantization (e.g., 4- or 6-bit) task is a much more resource consumptive problem in comparison with 8-bit quantization, it requires a significant amount of labeled training data. We propose a new low-bit quantization method for mobile neural network architectures that doesn’t require training from scratch and a big amount of train labeled data and allows to avoid significant accuracy drop.

Язык оригиналаанглийский
Название основной публикацииAdvances in Computational Intelligence - 16th International Work-Conference on Artificial Neural Networks, IWANN 2021, Proceedings
РедакторыIgnacio Rojas, Gonzalo Joya, Andreu Catala
ИздательSpringer Science and Business Media Deutschland GmbH
Страницы303-310
Число страниц8
ISBN (печатное издание)9783030850296
DOI
СостояниеОпубликовано - 2021
Событие16th International Work-Conference on Artificial Neural Networks, IWANN 2021 - Virtual, Online
Продолжительность: 16 июн 202118 июн 2021

Серия публикаций

НазваниеLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Том12861 LNCS
ISSN (печатное издание)0302-9743
ISSN (электронное издание)1611-3349

Конференция

Конференция16th International Work-Conference on Artificial Neural Networks, IWANN 2021
ГородVirtual, Online
Период16.06.202118.06.2021

Предметные области OECD FOS+WOS

  • 1.01 МАТЕМАТИКА
  • 1.02 КОМПЬЮТЕРНЫЕ И ИНФОРМАЦИОННЫЕ НАУКИ

Fingerprint

Подробные сведения о темах исследования «Iterative Adaptation to Quantization Noise». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать