Что такое вмененка и упрощенка: Вмененка и упрощенка – в чем разница?

Содержание

Что лучше УСН или ЕНВД для ИП, ООО?

Многие ИП и организации задаются вопросом: что выгоднее — вмененка или упрощенка? В этой статье мы рассмотрим плюсы и минусы УСН и ЕНВД.

Скидка 45% в ноябре: 7 590 р. вместо 

13 800 р. за год работы

 

Простое ведение бухгалтерии

Система сама рассчитает налоги и напомнит вам о сроках платежей и сдачи отчетов

Автоматический расчет зарплаты, отпускных и больничных

Техподдержка 24/7, подсказки внутри сервиса, справочно-правовая база

Отправка отчетности через интернет

Отчеты и КУДиР формируются автоматически по данным бухучета

Электронный документооборот и быстрая проверка контрагентов

Документы, сделки, аналитические отчеты, сверка по НДС

 

Вопрос о том, какая система выгоднее, с начала 2021 года отпадает сам собой. ЕНВД отменяют, поэтому организации смогут выбирать только между ОСНО и УСН. У предпринимателей выбор больше — ОСНО, УСН, патент и самозанятость. Выберите режим с минимальной налоговой нагрузкой с помощью нашего бесплатного калькулятора. Если вы собираетесь переходить с ЕНВД на другой налоговый режим, прочитайте нашу статью — мы собрали в ней ответы на самые популярные вопросы по системам налогообложения. Не нашли ответа на свой вопрос? Задайте его в комментариях, обязательно ответим.

Общие черты УСН и ЕНВД

Упрощенка — специальный налоговый режим, при котором организация или ИП ведут упрощенный учет и освобождаются от ряда налогов: на имущество и прибыль, НДС (кроме импорта) и НДФЛ (для ИП без сотрудников). УСН можно применять при особых условиях, о которых мы уже писали. На упрощенке необходимо выбрать объект налогообложения: “Доходы” или “Доходы минус расходы”, — о критериях выбора мы также рассказывали в статье.

ЕНВД — также является спецрежимом, который освобождает бизнес от ряда налогов и подходит для определенных видов деятельности. Их перечень дан в ст. 346.26 НК РФ. Например: бытовые услуги, розничная торговля, грузоперевозки и пассажироперевозки.

Решение о применении этого спецрежима принимают регионы. При ЕНВД налог берется с вмененного (т.е., предполагаемого) дохода, а реальная прибыль не влияет на размер налога.

Сходство между двумя спецрежимами заключается в следующем:

  • УСН или ЕНВД выбирается добровольно.
  • Оба спецрежима можно применять при численности сотрудников менее ста и участии других организаций менее 25%.
  • Оба режима освобождают от уплаты налога на прибыль, НДС, налога на имущество. Исключения для УСН перечислены в ст. 346.11 НК РФ, для ЕНВД — в ст. 346.26 НК РФ.
  • ИП без сотрудников не платят НДФЛ (кроме дивидендов, выигрышей и некоторых других доходов).
  • Организации и ИП с работниками платят НДФЛ с зарплаты сотрудникам, страховые взносы, налог на транспорт, воду и землю, пошлины и акцизы — уплата и отчетность по ним происходит в общем порядке.
  • Авансовые платежи по УСН и уплата налога по ЕНВД производится ежеквартально, в течение 25 дней после завершения квартала.
  • Бухотчетность сдается в упрощенном виде.
  • При ЕНВД и УСН “Доходы” можно сделать налоговый вычет на сумму уплаченных страховых взносов за сотрудников, уменьшив налог до 50%. (При УСН “Доходы минус расходы” уплаченные взносы попадают в расходы и тоже уменьшают налоговую базу).
  • Если предприятие выходит за пределы критериев, которые назначены для спецрежима, оно переходит на ОСНО с начала того квартала, в котором возникло нарушение.

Отличия между УСН и ЕНВД

УСН ЕНВД
При УСН налог зависит от величины доходов или от разницы между доходами и расходами. Регионы имеют право снижать налоговую ставку. Налог на УСН “Доходы” платится только в том случае, если у предприятия были доходы. Налог на УСН “Доходы минус расходы” уплачивается всегда, даже при убытке, и тогда он составляет 1% от выручки предприятия. При ЕНВД налог уплачивается в любом случае, вне зависимости от прибыльности предприятия, и является фиксированной величиной. Налоговая ставка составляет 15%, а база для исчисления налога зависит от вмененной доходности вида деятельности и коэффициентов, которые устанавливают федеральные и муниципальные органы власти. Поэтому налог на ЕНВД нужно платить, даже если предприятие работало в убыток.
На упрощенке использовать контрольно-кассовую технику придется в большинстве случаев. На вмененке при продаже товаров и оказании услуг населению чаще всего достаточно выдать товарный чек или бланк строгой отчетности. Уточняйте требования для вашего вида деятельности.
При УСН налоговым периодом является календарный год, декларация сдается раз в год до 31 марта (организации) или до 30 апреля (ИП). Но авансовые платежи по налогу делаются раз в квартал в течение 25 дней после завершения квартала.  При ЕНВД налоговый период — квартал, налог уплачивается в течение 25 дней, а декларация подается в течение 20 дней после завершения отчетного квартала.
УСН можно начать применять с начала календарного года.  Применять ЕНВД или отказаться от него можно в любом месяце.

Когда выгоднее применять УСН или ЕНВД?

Применять ЕНВД выгодно, когда бизнес приносит гораздо больший доход, чем установленный вмененный доход по данному виду деятельности. Тогда предприятие будет платить меньший налог, чем оно уплатило бы на УСН.

Если же бизнес приносит доход приблизительно равный или меньший, чем вмененный доход, то выгоднее применять УСН. Важно только разобраться, какой объект налогообложения лучше подойдет вашему предприятию. Мы уже писали, какой вид УСН стоит выбрать в зависимости от условий работы компании.

Но, конечно, выгоду применения УСН или ЕНВД нужно внимательно оценивать и просчитывать на основе реальных показателей деятельности предприятия, с учетом всех условий, в которых она ведется: наличие сотрудников, налоговая ставка в регионе и т. д.

Если бизнес ведет несколько направлений деятельности, то по одним направлениям он может применять УСН, а по другим ЕНВД.

Онлайн-сервис Контур.Бухгалтерия поможет вам легко рассчитать все налоги. Если вы не можете определиться самостоятельно, то доверьте учет профессиональному бухгалтеру

Найти бухгалтера

Вам будут интересны статьи по теме «ЕНВД»

Патент, упрощенка или самозанятость: на что саратовский бизнес может сменить ЕНВД

Единый налог на вмененный доход (ЕНВД) доживает в России последние месяцы. Режим налогообложения, действие которого неоднократно продлевалось, будет полностью отменен с 1 января 2021 года.

До сих пор ЕНВД был и остается наиболее востребованным малым бизнесом вариантом налогообложения. Отказаться от него федеральное руководство планировало давно. В порядке эксперимента данный режим был отменен в Пермском крае, что привело к массовой перерегистрации предприятий в соседней Удмуртии, где для бизнеса ввели двухлетние налоговые льготы при условии дальнейшего перехода на УСН.

О полной отмене ЕНВД с 2021 года нынешним летом объявил премьер-министр Михаил Мишустин, который назвал его бесполезным для бюджета. Между тем, представители бизнес-сообщества высказывали опасения, что отмена привычной системы уплаты налогов уведет массу компаний в тень.

Напомним, ЕНВД рассчитывается, исходя из предполагаемой прибыли компании и составляет 15% от нее. Такой налог заменяет налог на прибыль, имущество и НДС, потому он и стал так популярен у сферы услуг, розничной торговли и общепита.

Например, в Саратовской области его используют более 50% ИП, работающих в общепите. Отметим, что на начальном этапе распределения господдержки для бизнеса, 

власти вообще забыли про плательщиков ЕНВД, хотя именно по кафе и мелкой рознице в первую очередь ударил весенний локдаун.

В конце августа в Госдуму был внесен законопроект, предполагающий сохранить действие ЕНВД до 2025 года. Но ситуация осталась прежней и действие налога должно прекратиться с начала следующего года.

В связи с этим саратовские налоговики напоминают, какой режим может выбрать малый бизнес вместо ЕНВД. Так, организации и ИП могут перейти на упрощенную систему налогообложения. Если индивидуальному предпринимателю для деятельности компании нужно не более 15 сотрудников, он может воспользоваться патентной системой. Если у него вообще нет наемных работников, можно перейти в режим самозанятости. Данные режимы освобождают предпринимателей от тех же налогов, что и ЕНВД — налога на прибыль организаций, НДС и налога на имущество.

Эксперты: предприниматели в РФ после отмены ЕНВД будут переходить на «упрощенку» и патент — Экономика и бизнес

МОСКВА, 10 августа. /ТАСС/. Российские предприниматели, которые применяют единый налог на вмененный доход (ЕНВД), после отмены этого режима в 2021 году будут переходить на упрощенную или патентную системы налогообложения. Такое мнение высказали опрошенные ТАСС представители бизнес-объединений и эксперты.

Решение об отмене ЕНВД с 1 января 2021 года много раз обсуждалось и является принятым, заявил в конце июля председатель правительства РФ Михаил Мишустин.

ЕНВД (или так называемая вмененка) является одной из самых простых и выгодных систем налогообложения для малого и среднего бизнеса. Налог не зависит от полученной выручки, он рассчитывается исходя из предполагаемого — вмененного дохода по ставке от 7% до 15% в зависимости от региона России. При этом те предприниматели, которые пользуются ЕНВД, освобождаются от уплаты налога на прибыль, НДС, кроме импортного, и налога на имущество, кроме рассчитываемого по кадастровой стоимости. Данный режим в России применяют около 280 тыс. организаций и 1,8 млн индивидуальных предпринимателей.

Преимущества «упрощенки» и патента

Перейти можно на два режима: упрощенную систему налогообложения (УСН) и патент (не работает для юридических лиц), а можно уйти в самозанятые, если позволяют параметры, сказал ТАСС советник уполномоченного при президенте России по защите прав предпринимателей Антон Свириденко.

«В последнее время параметры применения патентной системы сильно модифицировали, расширив торговую площадь и дав право зачитывать страховые взносы. И патент стал удобнее для применения. Ставки упрощенной системы налогообложения в этом году во многих регионах в качестве антикризисной меры снижены, поэтому есть много случаев, когда предприниматели хотят перейти на УСН уже сейчас. Однако не решен главный вопрос — общее снижение ставок в федеральном законе, хотя бы для отдельных видов деятельности», — отметил он.

Член генерального совета бизнес-объединения «Деловая Россия» Сергей Гебель также убежден, что бизнес выберет «упрощенку» или патент, что приведет к «увеличению налогового бремени, но не к радикальному, а с минимально возможными потерями». «Недавние изменения налогового законодательства коснулись этих спецрежимов, что, очевидно, делает их более гибкими и адаптированными к бизнесу», — сказал он.

Гебель не исключил, что с учетом последствий пандемии коронавируса многие предприниматели с небольшими оборотами перейдут на режим для самозанятых — налог на профессиональный доход. «Налог для самозанятых получает распространение, пользуется популярностью среди «мелкого» бизнеса. Все это, полагаю, вполне достойные альтернативы. Но нужно помнить, что указанные спецрежимы могут применяться не ко всем видам деятельности и при соответствии определенным условиям. Следовательно, некоторые предприниматели будут вынуждены перейти на применение общей системы, что существенно увеличит налоговую нагрузку», — уточнил собеседник агентства.

Процесс перехода на новый режим

С точки зрения перехода к применению другой системы налогообложения особых сложностей не должно возникнуть, уверены представители бизнес-объединений.

«Так, для перехода на «упрощенку» достаточно уведомить об этом налоговый орган по месту учета, но сделать это нужно до 31 декабря 2020 года, то есть, можно и сейчас. Главное — соответствовать критериям для применения этого спецрежима. Для перехода к применению патентной системы необходимо не позднее чем за 10 дней до начала ее применения направить почтой с описью вложения или по телекоммуникационным каналам связи в налоговый орган заявление на получение патента. Для применения режима для самозанятых необходимо встать на учет плательщика этого налога с использованием приложения «Мой налог», — рассказал Гебель.

Однако есть и исключения. Если субъект бизнеса в этом году перестал быть плательщиком налога на вмененный доход, то перейти на «упрощенку» можно с начала того месяца, когда была прекращена обязанность по уплате ЕНВД. «В этом случае надо подать заявление о выборе системы налогообложения не позднее 30 дней со дня прекращения обязанности по ЕНВД», — сказал ТАСС доцент Российского экономического университета им. Плеханова, член «Партии роста» Вадим Ковригин.

«Я бы посоветовал бизнесу взвесить все «за» и «против». Если переход пока не является выгодным — дождаться официальной отмены ЕНВД и до 31 декабря подать заявление о выборе системы налогообложения. Если УСН окажется меньше, то можно подумать о переходе сейчас, но понимая бухгалтерские и административные риски», — советует эксперт.

Глава «Опоры России» Александр Калинин отметил, что правительство и депутатский корпус сделали достаточно для «бесшовного» перехода с ЕНВД на другие режимы. В частности, расширили для индивидуальных предпринимателей возможность применения патентной системы, распространили возможность вводить режим самозанятых на все регионы.

«Необходима большая разъяснительная работа со стороны Минфина и ФНС, которая должна основываться на конкретных примерах и расчетах для различных отраслей, направлений и сфер деятельности, доказывающая представителям бизнес-сообщества, что переход с ЕНВД на другие системы налогообложения действительно является «бесшовным», что он не бьет по карману и не создает проблемы по подготовке дополнительной отчетности», — сказал ТАСС президент Торгово-промышленной палаты России Сергей Катырин.

Риски для бизнеса

Главное достоинство ЕНВД состоит не в том, что эта система позволяла платить меньше, ведь в некоторых случаях размер уплачиваемого налога был даже больше, чем при использовании традиционной системы налогообложения, а в возможности малого бизнеса заметно экономить на бухгалтерских и административных операциях. Так, при «вмененке» субъекты малого бизнеса были освобождены почти от всех отчетностей, напомнил Ковригин.

«В целом, можно предположить, что отмена ЕНВД, безусловно, негативно скажется на стартапах, микробизнесе — ведь бухгалтерские и административные издержки для них могут оказаться неподъемными», — считает он.

Сергей Гебель, напротив, не видит существенных рисков в отмене ЕНВД, кроме потенциального увеличения налоговой нагрузки. И то за исключением более выгодного налога для самозанятых. «Вместе с тем, на мой взгляд, применение в одной отрасли одинаковой системы налогообложения может обеспечить баланс и конкурентную предпринимательскую среду. Сейчас, например, одни в отрасли применяют ЕНВД, другие, в силу ограничений — общую систему. Налоговая нагрузка при относительно одинаковой норме прибыли разная, то есть одни имеют преимущество перед другими. Полагаю, применение одинакового режима позволит предпринимателям на конкурентных условиях осуществлять деятельность и совместно на равных условиях развивать отрасль экономики», — полагает он.

ЕНВД или УСН для ИП — что лучше в 2020 году?

Posted On 28 июля, 2020

Вид налогообложения играет важную роль — от выбора будет зависеть сумма вашего налога, а значит и прибыль, которую вы заберете в карман. ИП часто задаются вопросом — что лучше ЕНВД или УСН? В этой статье мы рассмотрим, что общего между этими системами налогообложения и в отдельности рассмотрим минусы и плюсы каждой. А также на примерах грузоперевозки и розничной торговли — произведем предварительный расчет налога.

Что такое УСН — упрощенка

УСН — это упрощенная система налогообложения. Она “упрощена” тем, что отчитываться по ней надо всего 1 раз в год. Налог по упрощенке — единый, он заменяет собой:

  • НДС, кроме импорта.
  • НДФЛ — в отношении доходов от предпринимательской деятельности.
  • Имущественный налог, кроме объектов недвижимости, которые включены в перечень, определяемый в соответствии с п. 7 ст. 378.2 НК РФ, как кадастровая стоимость.

На упрощенке вы можете выбрать режим налогообложения:

  • УСН 6% доходы — на этом режиме вы будете платить со всех доходов(поступающих денег) 6%.
  • УСН 15% доходы минус расходы — на этом режиме вы будете платить 15% с разницы между доходами и расходами. Только учитывайте, что перечень расходов, на которые можно снизить налогооблагаемую базу является закрытым, и регламентируется п. 1 ст. 346.16 НК РФ.

УСН 6% — легок в расчете. При его применении у вас есть возможность снизить налоги на сумму страховых взносов за себя или сотрудников. Сделать это можно в случае уплаты их в расчетный (налоговый) период, т.е. период за который вы платите налог. Если на ИП нет работников, то налог можно уменьшить на 100% уплаченных страховых взносов. Если работники есть, то налог можно уменьшить не более чем на 50%.

УСН 15%- более сложный в расчете налога, так как предполагает учет конкретного перечня расходов, для уменьшения налогооблагаемой базы. Он выгоден в тех случаях, когда для осуществления деятельности вы несете большие затраты, более 60-70% от дохода.

А также на УСН 15%, действует правило минимального налога: если по итогам года сумма исчисленного налога оказалась меньше 1% от годового дохода, уплачивается минимальный налог в размере 1%.

Доход — это все поступления денежных средств, полученные физическим или юридическим лицом за определенный промежуток времени.

При выборе одного из режимов, вы не сможете поменять его в течение года на другой. Смена системы налогообложения на УСН (любой из режимов) возможен только со следующего года. Заявление налоговая принимает до 31 декабря текущего года.

При этом помните, что подача заявления и переход — это разные понятия, если вы неправильно составите заявление, или нарушен один из пунктов, позволяющий переход на УСН — налоговая может вам отказать. А если вы подали заявление слишком поздно и не успеете в срок исправить ошибки, то придется ждать еще один год для перехода. Поэтому подавайте заявление заранее.

На упрощенке есть ряд ограничений, которым нужно следовать, чтобы иметь право использовать этот режим:

  • Лимит на доходы — 150 млн в год.
  • Лимит на величину основных средств — не более 150 млн ₽ в год.
  • Количество сотрудников: до 100 человек.

При нарушении одного из этих пунктов вы не имеете права применять упрощенку.

А также есть перечень налогоплательщиков, не имеющих право применять УСН, указанные в п.3 ст. 346.12, например: банки, ломбарды.

Плюсы и минусы УСН

Плюсы:

  • Упрощена система отчетности — сдавать декларацию нужно всего раз в год.
  • Единый налог — заменяет ряд других налогов.
  • На УСН Доходы — есть возможность снизить начисленный налог на уплаченные страховые взносы за себя и сотрудников.
  • В некоторых регионах доступны льготные ставки и налоговые каникулы.

Минусы:

  • Ограничения на доходы, лимит основных средств и количество сотрудников.
  • На УСН Доходы минус расходы — обязанность платить “минимальный налог”, даже при убытке.
  • Возможность перейти на эту систему — только с начала следующего года (или при регистрации ИП).

Что такое ЕНВД — вмененка

ЕНВД — единый налог на вмененный доход. Сокращенно эту систему называют “вмененка”.

Вменять — означает обязывать. Т.е. государство определило средние показатели по видам деятельности и само определило базовую доходность, по которой рассчитывается налог.

На этой системе ваш налог не будет зависеть от фактической вашей прибыли, тут важны физические величины, такие как — количество сотрудников, квадратных метров площадей или количество автомобилей, аппаратов и т.п. А также коэффициенты, которые ежегодно устанавливаются Минэкономразвитием РФ и местными властями.

Если вы на ЕНВД — необходимо платить налог независимо от того есть ли доход!

Расчет налога более сложный, чем на УСН и производится по формуле:

БД * ФП * К1 * К2 * 15% = сумма вмененного налога в месяц

Где:

  • БД — Базовая доходность в месяц на единицу физ.показателя, размер закреплен в статье 346.29 НК РФ
  • ФП — физический показатель(кол-во работников, торговых автоматов, посадочных мест и т.п.)
  • К1 — коэффициент-дефлятор, устанавливается ежегодно по приказу Минэкономразвития РФ
  • К2 — коэффициент, учитывающий особенности ведения предпринимательской деятельности (ассортимент товаров (работ, услуг), сезонность, режим работы, величину доходов, особенности места ведения предпринимательской деятельности и пр.) Его устанавливают местные власти. Ставка варьируется от 0,005 до 1.Узнать ставку можно на сайте налоговой, установив свой регион.
  • 15% — установленная ставка налога.

Ограничения на ЕНВД:

  • Количество сотрудников не может превышать 100 человек.
  • Площадь торгового зала не может превышать 150 кв.м.

На ЕНВД, так же как на УСН 6% можно уменьшить налог на сумму уплаченных страховых взносов — до 50% если на ИП есть сотрудники, и до 100% если сотрудников нет. При этом уплата взносов должна быть в отчетном периоде, за который уплачивается налог.

Применять ЕНВД можно только на определенные виды предпринимательской деятельности:

1) Оказания бытовых услуг.

2) Оказания ветеринарных услуг.

3) Оказания услуг по ремонту, техническому обслуживанию и мойке автомототранспортных средств.

4) Оказания услуг по аренде мест для стоянки и хранения автомототранспортных средств (за исключением штрафных автостоянок).

5) Оказания автотранспортных услуг по перевозке пассажиров и грузов. При условии наличия не более 20 транспортных средств.

6) Розничной торговли, осуществляемой через магазины и павильоны с площадью торгового зала не более 150 квадратных метров по каждому объекту организации торговли.

7) Розничной торговли, осуществляемой через объекты стационарной торговой сети, не имеющей торговых залов, а также объекты нестационарной торговой сети.

8) Оказания услуг общественного питания (не более 150 квадратных метров по каждому объекту организации общественного питания).

9) Оказания услуг общественного питания, осуществляемых через объекты организации общественного питания, не имеющие зала обслуживания посетителей.

10) Распространения наружной рекламы с использованием рекламных конструкций.

11) Размещения рекламы с использованием внешних и внутренних поверхностей транспортных средств.

12) Оказания услуг по временному размещению и проживанию (общая площадь не более 500 квадратных метров).

13) Оказания услуг по передаче во временное владение и (или) в пользование торговых мест.

14) Оказания услуг по передаче во временное владение и (или) в пользование земельных участков для размещения объектов стационарной и нестационарной торговой сети, а также объектов организации общественного питания.

ЕНВД можно применять не во всех регионах, в Москве, например, применять его нельзя. А также поднимается вопрос о закрытии данной системы налогообложения.

Срок действия ЕНВД продлен до 01 января 2021 года. После этого, возможно, продления не будет. Ранее предполагалось, что система налогообложения в виде ЕНВД будет отменена с 1 января 2018 года.

Плюсы и минусы ЕНВД

Плюсы:

  • Если ваш фактический доход выше, чем вмененный — то вы будете экономить на налоге.
  • Единый налог — освобождает от уплаты ряда налогов.
  • Нет ограничения по доходам.
  • Возможность снизить налог на сумму уплаченных страховых взносов (за себя и сотрудников).
  • Отказаться от применения ЕНВД можно в любом месяце (при условии совмещения налоговых режимов).
  • Вы заранее знаете сумму налога, т.к. она не зависит от ваших доходов.

Минусы:

  • Закрытый перечень видов деятельности.
  • Сдача отчетности и уплата налога — ежеквартально.
  • Более сложный расчет налога, по сравнению с УСН.
  • Необходимо следить за изменением коэффициентов.
  • Есть ограничения на количество сотрудников и площадь торгового зала.
  • Налог необходимо платить, даже если отсутствует деятельность.
  • Применять ЕНВД можно не во всех регионах.
  • ЕНВД могут отменить. На данный момент срок действия продлен до 01.01.2021 года.
  • Расчет и уплата налога по видам деятельности подпадающим под систему ЕНВД производится отдельно по каждому. Т.е. если вы занимаетесь грузоперевозками и открыли магазин розничной торговли, то расчет налога нужно будет производить отдельно по грузоперевозкам, где физическим показателем (ФП) — являются автомобили и отдельно по магазину, где ФП являются м2 помещения.

Таблица отличий УСН и ЕНВД

Параметры сравненияУСНЕНВД
6% Доходы15% Доходы минус расходы
Виды деятельностиОткрытый переченьЗакрытый перечень
Ограничения

Лимит на доходы — 150 млн в год

Лимит на величину основных средств — не более 150 млн ₽ в год

Количество сотрудников: до 100 человек

Количество сотрудников не может превышать 100 человек

Площадь торгового зала не может превышать 150 кв.м

Переход на данную систему налогообложенияС начала календарного годаС начала календарного года. При совмещении режимов, с начала любого месяца
Отказ от данной системы налогообложенияС начала календарного года по желанию или в момент утраты права применять данную системуС любого месяца (при условии совмещения налоговых режимов)
Сдача отчетностиРаз в годЕжеквартально
Уплата налогаАвансовые платежи раз в квартал. Итоговый расчет до 30.04 следующего годаЕжеквартально
Уплата налога в случае отсутствия деятельностиНичего платить не надо, так как налог начисляется на поступающие деньги, если поступлений нет, то и налога нетЕсли нет деятельности, платить не надо. А если деятельность есть, но убыточная, все равно придется заплатить 1% от всех доходовВ любом случае уплачиваются фиксированные суммы налога, по данным — базовой доходности и физическим показателям
Уменьшение суммы исчисленного налога на страховые взносыНа ИП без работников до 100%, с работниками до 50%НетНа ИП без работников до 100%, с работниками до 50%
Возможность определения суммы налога заранееНет, т.к. налог начисляется на поступающие денежные средстваНет, т.к. налог начисляется на разницу между доходами и расходамиЕсть, т.к. налог зависит от выбранного вида деятельности и физических величин
Льготы

Законами субъектов РФ могут установлены ставки от 0 до 6%.

Возможность применения “Налоговых каникул” для новых ИП согласно пункту 4 статьи 346.20 НК РФ

Законами субъектов РФ могут установлены ставки от 5 до 15%

Возможность применения “Налоговых каникул” согласно пункту 4 статьи 346.20 НК РФ

Нет

Сходство ЕНВД и УСН

  • Единый налог — который заменяет собой ряд других налогов.
  • Ограничение на количество сотрудников — 100 человек.
  • Оба спецрежима добровольны.
  • Уплата страховых взносов за себя и сотрудников одинаковая, независимо от выбранной системы налогообложения.
  • Возможность уменьшать сумму налога на уплаченные страховые взносы за себя и работников (кроме УСН 15% доходы минус расходы).

Что выгоднее применять — ЕНВД или УСН, на ИП без работников и с ними

На ЕНВД и УСН 6% Доходы есть возможность уменьшить сумму налога на уплаченные страховые взносы за себя и работников. Если на ИП нет работников, сумму налога можно уменьшить до 100 %, на сумму налога, уплаченную в отчетный период, т.е. в тот же период, за который вы отчитываетесь по налогу. Поэтому есть смысл платить страховые взносы за себя равными частями ежеквартально.

ИП с работниками, на ЕНВД и УСН 6% Доходы, может уменьшить сумму налога до 50% на сумму уплаченных страховых взносов за себя и работников, уплаченных в отчетном периоде.

Напомню, что в 2020 фиксированные взносы за себя составляют:

Страховые взносы на обязательное пенсионное страхование (ОПС) — 32 448 ₽.

Страховые взносы на обязательное медицинское страхование (ОМС) — 8 426 ₽.

Общая сумма фиксированных взносов ИП в 2020 году составляет 40 874 ₽

Помимо этого, если доход за год превышает 300 тыс. ₽, предприниматель обязан уплатить на ОПС еще дополнительно 1% с суммы дохода, превышающего этот предел. При этом на ЕНВД учитывается вмененный доход, а не фактический.

На УСН 15% Доходы минус расходы уменьшать сумму налога на уплаченные страховые взносы нельзя.

Получается, что ЕНВД и УСН 6% находятся на равном положении независимо от того есть работники на ИП или нет. В этом пункте уступает только УСН 15%, но это не означает, что данная система невыгодна.

Что выбрать УСН или ЕНВД

Чтобы однозначно сказать какая система налогообложения выгоднее, нужно определить:

  • Вид деятельности — помним что ЕНВД можно применять на ограниченный перечень видов деятельности.
  • Регион, в котором будет осуществляться деятельность — так как от него зависит ставка дохода (возможны льготы по УСН), а также помним что ЕНВД доступен не во всех регионах и коэффициенты зависят от них.
  • Сумму предполагаемого дохода.
  • Сумму предполагаемых расходов.
  • Количество сотрудников.

Применять ЕНВД выгодно, когда фактический налог выше, чем вмененный доход по данному виду деятельности. В этом случае вы будете платить меньше налог чем, на УСН при равном доходе.

Если доход равен или ниже вмененного, то лучше выбрать УСН — так как его проще считать и налоговый период у него год, а не квартал. А вот выбрать УСН 6 % или 15% — зависит от ваших расходов, как я писала выше УСН 15% выгоден в случаях когда расходы выше 60-70% от дохода.

Совмещение налоговых режимов УСН и ЕНВД

При желании ИП могут совмещать налоговые режимы ЕНВД и УСН, но при этом необходимо соблюдать следующие критерии:

  • Общая численность ИП не должна превышать 100 человек.
  • Остаточная стоимость основных средств по ИП не должна превышать 150 млн ₽.
  • Необходимо вести раздельный учет по УСН и ЕНВД.

Ограничение на УСН по доходам так же остается — 150 млн ₽, но учитываются они отдельно от ЕНВД.

УСН 6% и ЕНВД схожи во многих аспектах, а потому очень удобно совмещать данные режимы налогообложения.

ИП без работников могут уменьшать налог на уплаченные страховые взносы до 100%. А ИП с работниками должны разграничить — по какому виду деятельности задействованы сотрудники и от этого уже отталкиваться в плане вычетов. Если сотрудники задействованы только по ЕНВД, то налог на УСН вы можете уменьшить до 100% на сумму уплаченных страховых взносов за себя. А на ЕНВД до 50% — на страховые выплаты за сотрудников. И наоборот.

Если работники задействованы на все виды деятельности, то для уменьшения налогов необходимо разделить взносы прямо пропорционально доли доходов. Т.е. если УСН приносит 60% от общего дохода ИП, а ЕНВД 40%, то и расходы на страховые взносы вы распределяете так же.

Что лучше УСН или ЕНВД на ИП Грузоперевозки

Грузоперевозки относятся к одному из самых распространенных деятельностей ИП. Предприниматели для услуг могут использовать собственные транспортные средства или арендованные.

На ЕНВД есть ряд ограничений при осуществлении данного вида деятельности:

  • Предприниматель не может иметь автопарк, состоящий более чем из 20 единиц — своих или арендованных автомобилей.
  • Нельзя использовать договора транспортного экспедирования грузов. Вы можете только самостоятельно (сами или ваши сотрудники) перевозить грузы — своим или арендованным транспортом. В ином случае применять ЕНВД запрещено.

Если у вас небольшой автопарк, то ЕНВД может быть более выгодным, чем другие системы. Давайте на примере рассмотрим, что лучше выбрать — УСН 6% или ЕНВД для грузоперевозок, при равных условиях.

Александр имеет в собственности 2 автомобиля и 3 арендует. Прогнозируемый доход составляет 55 тыс. ₽ с одного автомобиля в месяц. Расходы учитывать не будем, т.к. на расчет налога они не повлияют (на данных системах налогообложения).

УСН 6% Доходы

Налог на УСН 6% = 24 750 ₽

Расчет дохода: 55 000 х 5 х 3 = 825 000

Расчет налога: 825 000 х 6% = 49 500

Данную сумму можно уменьшить до 50% на сумму уплаченных страховых взносов, получается 24 750 ₽.

ЕНВД

Как писала выше — расчет ЕНВД производится по формуле:

БД * ФП * К1 * К2 * 15% = сумма вмененного налога в месяц.

В нашем примере:

БД (базовая доходность) = 6 000 ₽.

К1 (в 2020 году) = 2,009.

К2 (устанавливается регионом) = 1.

ФП (физический показатель) = 5 (количество автомобилей).

Налог на ЕНВД = 13 560,75 ₽

6 000 х 5 х 2,009 х 1 х 15% = 9 040,50 в месяц

9 040,50 х 3 = 27 121,50

Данную сумму можно уменьшить до 50% на сумму уплаченных страховых взносов (если сумма страховых взносов равна или больше 50%), получается 13 560,75.

В данном примере, при данных условиях применение ЕНВД более выгодно.

Как я говорила выше, ЕНВД выгодно применять — если фактический доход выше вмененного, в этом случае вы будете экономить на налоге. А вот если у вас небольшой доход или бываю простои — ЕНВД неудобен, т.к. платить фиксированный налог придется в любом случае.

УСН 15% Доходы минус расходы

Если доля расходов на осуществление грузоперевозок выше 60-70 %, то выбирайте УСН 15%. К расходам вы можете отнести все, что касается осуществления данного вида услуг: зарплату и командировочные сотрудникам, расходы на аренду автомобилей и содержание служебного транспорта и т.п.

Только помните, что на УСН 15% Доходы минус расходы — нельзя уменьшить налог на сумму страховых взносов. А это иногда играет решающую роль в выборе налогообложения.

Что лучше ЕНВД или УСН на ИП Розничная торговля

Розничная торговля, тоже относится к одному из самых распространенных видов деятельности предпринимателей. Если вы решили открыть магазинчик и торговать там канцтоварами или сувенирным мылом и другими предметами для личных нужд покупателей — вы можете рассматривать ЕНВД в качестве системы налогообложения своего бизнеса. Ограничением по применению ЕНВД в данной сфере является:

Стационарные объекты не имеющие торговых залов — это объекты, которые расположены в зданиях и сооружениях, предназначенных для торговли. Это могут быть крытые рынки, киоски, торговые комплексы. Главным критерием является их стационарность (неподвижность) и отсутствие торгового зала — т.е. покупатели не могут зайти на вашу территорию.

Нестационарные объекты — это развозная или разносная торговля или объекты которые не относятся к стационарным — например, цистерны по продаже кваса и лимонада или автоприцепы. Т.е. у них нет прочной связи с землей (местом).

Стационарный объекты с торговыми залами — это магазины, павильоны и т.п.

Базовая доходность (БД) в каждом случае определяется по разным физическим показателям:

  • Розничная торговля, осуществляемая через объекты стационарной торговой сети, имеющие торговые залы — ФП (физический показатель) — площадь торгового зала в м2 — БД 1800 ₽ за каждый.
  • Розничная торговля, осуществляемая через объекты стационарной торговой сети, не имеющие торговых залов, а также через объекты нестационарной торговой сети, площадь торгового места в которых НЕ превышает 5 квадратных метров — ФП — количество торговых мест (точек) — БД 9 000 ₽ за каждый.
  • Розничная торговля, осуществляемая через объекты стационарной торговой сети, не имеющие торговых залов, а также через объекты нестационарной торговой сети, площадь торгового места в которых превышает 5 квадратных метров — ФП — площадь торгового зала в м2 — БД 1800 за каждый.
  • Развозная и разносная розничная торговля — ФП — Количество работников, включая индивидуального предпринимателя — БД 4500 за каждого.

Т.е. если у вас магазин — то для вас налог будет рассчитываться в зависимости от площади торгового зала, если киоски и они до 5 м2, то будет учитываться количество киосков (если киоски больше 5 м2, то также будет расчет налога на площадь помещения), если занимаетесь развозной торговлей, то платить налог будете за каждого сотрудника, включая себя.

Это то что касается розничной торговли по ЕНВД.

На УСН 6% и 15% все остается неизменным. Расчет налога на них не зависит от деятельности. На УСН 6% платите за все “входящие” деньги 6%, на УСН 15% — платите налог 15% с разницы между доходами и расходами.

Теперь вот давайте попробуем определить что же выгоднее при осуществлении розничной торговли — УСН или ЕНВД. На самом деле в подсчете очень важна маржа. Без ее определения наш пример будет только для показа — как производить расчет налога на данных системах. Поэтому произведите собственный расчет по аналогии:

Предположим что вы открыли магазинчик по продаже канцтоваров. Помещение в 30 м2 вы арендовали за 30 000 ₽ в месяц. Затраты на покупку товара у вас составляет 100 тыс. ₽ в месяц, а доходы 280 тыс. ₽ в месяц. Вы наняли двух сотрудников с оплатой труда 15 000 ₽ каждому, а значит ежемесячно уплачиваете страховые взносы за сотрудников: 9 060 ₽ и за себя в квартал 9 059,50 ₽.

Итак, дано:

  • Доходы — 840 000 ₽ в квартал.
  • Расходы:
    • Аренда помещения — 90 000 ₽ в квартал.
    • Затраты на покупку товара — 300 000 ₽ в квартал.
    • Заработная плата работникам — 90 000 ₽ в квартал.
    • Страховые взносы за работников — 27 180 ₽ в квартал.
    • Страховые взносы за себя — 9 059,50 в квартал.

УСН 6% Доходы

Расчет налога: 840 000 х 6% = 50 400

Налог уменьшаем до 50% на сумму страховых взносов, получается 25 200 ₽

Расчет прибыли: 840 000 — 90 000 — 300 000 — 90 000 — 27 180 — 9 059,50 — 25 200 = 298 560,50 ₽

УСН 15% Доходы минус расходы

Расчет затрат: 90 000 + 300 000 + 90 000 + 27 180 + 9 059,50 = 516 239,50

Расчет налогооблагаемой базы: 840 000 — 516 239,50 = 323 760,50

Расчет налога: 323 760,50 х 15% = 48 564,10 ₽

Данную сумму мы не можем уменьшить за счет страховых взносов.

Расчет прибыли: 840 000 — 516 239,50 — 48 564 ,10 = 275 196,40 ₽

ЕНВД

БД * ФП * К1 * К2 * 15% = сумма вмененного налога в месяц.

В нашем примере:

БД (базовая доходность) = 1 800 ₽.

К1 (в 2020 году) = 2,009.

К2 (устанавливается регионом) = 1.

ФП (физический показатель) = 30 м2.

Расчет налога: 1 800 х 2,009 х 30 х 1 х 15% = 16 272,90 в месяц

За квартал налог составит 48 818,70

Уменьшаем его до 50% на сумму уплаченных страховых взносов, получаем 24 409,35 ₽

Расчет прибыли: 840 000 — 516 239,50 — 24 409,35= 299 351,15 ₽

Данный пример опять показывает наиболее выгодным — применение ЕНВД, но как я уже писала, для верного расчета важно определить ваш потенциальный доход и правильно учесть расходы, тогда картина может измениться.

Если вам необходимо рассчитать сумму налога и прибыли, по предварительным данным — пишите в комментариях, буду рада помочь.

Подведем итоги

Разнообразие систем налогообложения предполагает, что при каких-то условиях наиболее выгодна одна из них. Поэтому нельзя сказать однозначно какая из них лучше. Необходимо учитывать индивидуальные особенности ведения вашего бизнеса.

Подчеркнем еще раз основные моменты:

  • ЕНВД выгодно применять когда фактический доход выше вмененного.
  • УСН 15% выгодно применять, когда сумма расходов превышает 60-70% доходов.
  • ЕНВД и УСН схожи в некоторых аспектах: количество сотрудников не может превышать 100 человек и можно уменьшить налог на сумму страховых взносов (кроме УСН 15%).
  • На ЕНВД нет ограничения по доходам.
  • На УСН доходы не могут превышать 150 млн в год.
  • На ЕНВД необходимо платить налог, даже если нет деятельности и доходов.
  • На грузоперевозках при ЕНВД количество автомобилей не может превышать 20 единиц.
  • ЕНВД и УСН можно совмещать, но отчитываться придется по каждой в отдельности.

Может быть полезно:

Интересно:

  • Каким видом деятельности собираетесь заниматься?

Если нужна помощь — пишите вопросы в комментариях.

В Госдуме предложили продлить действие ЕНВД до 2025 года

Группа депутатов подготовила и внесла в Госдуму законопроект об изменениях в Налоговый кодекс и ст. 26 федерального закона «О банках и банковской деятельности», предлагая отложить отмену единого налога на вмененный доход (ЕНВД) до 1 января 2025 г. Действующее законодательство предусматривает действие ЕНВД только до конца этого года.

В пояснительной записке к законопроекту его авторы напомнили, что ЕНВД является одним из самых востребованных льготных режимов налогообложения, направленных на снижение налогового бремени для представителей малого бизнеса и обеспечение его стабильности, а также на упрощение порядка исчисления и уплаты налога. Законодатели считают, что отмена ЕНВД с 1 января 2021 г. может привести к финансовым потерям налогоплательщиков, применяющих сейчас эту систему, и увеличить затраты бизнеса на ведение бухгалтерского и налогового учета. Это, в свою очередь, может привести к сокращению количества малых предприятий и вызвать негативные последствия для местных и региональных бюджетов. «Сохранение данного налогового режима позволит не только оказать реальную поддержку малому бизнесу и создать налоговые стимулы для его развития, но и сохранить стабильный источник налоговых доходов бюджетов муниципальных образований», – говорится в пояснительной записке к проекту.

Между тем в регионах бизнес, не дожидаясь решения по законопроекту, пытается добиться продления льготного налогового режима своими способами. «Мы активно боремся за продление ЕНВД. Подписывается петиция. Во многих городах России проходит акция, выражающая волю бизнеса о сохранении единого налога», – говорит экономист Наталия Пятых. По ее оценкам, отмена вмененки приведет к увеличению налоговой нагрузки в несколько раз. Защитники единого налога подчеркивают, что отменять ЕНВД нужно, но только не сейчас, когда важнее поддержать малый и средний бизнес, чем занять жесткую позицию в борьбе с возможными злоупотреблениями этой льготой.

«ЕНВД – тот самый налог, за который бьются регионы: он остается в региональном бюджете и дает им возможность решать проблемы местного уровня, которые не предусмотрены федеральным бюджетом. С учетом сложной экономической ситуации эти деньги регионам сейчас будут очень нужны. Что касается малого и среднего бизнеса, для поддержки которого в свое время вводили ЕНВД, то сейчас мы видим, что по факту коронавирус обнулил достижения предыдущих лет в этом вопросе. И, я думаю, будет в корне неправильно добивать налоговыми изменениями тех, кто выжил в период ограничений», – поддержал инициаторов законопроекта председатель комитета по нацпроектам регионального парламента Волгоградской области Олег Савченко.

Базовым полигоном, где можно наглядно увидеть последствия отмены ЕНВД, стала Пермь, где местные депутаты еще в прошлом году приняли решение о досрочном отказе от налоговой льготы. В соседней Удмуртии губернатор, напротив, предложил льготные налоговые условия в течение первых двух лет тем, кто перерегистрируется на упрощенную систему налогообложения (УСН). «После того как у предпринимателей по некоторым видам деятельности налоги выросли от 4 до 20 раз, в Чайковске, расположенном вблизи границы с Удмуртией, многие поспешили зарегистрировать бизнес по УСН, но уже в Удмуртии, где нерезидентам с января 2020 г. установили пониженные ставки налога. Уже в первые месяцы года в Удмуртии сообщали, что предприниматели из других регионов подали около 400 заявок на перерегистрацию бизнеса. Уверен, что большая часть этих заявок была из Пермского края», – рассказал «Ведомостям» член пермской «Опоры России» на условиях анонимности.

В Перми говорят, что коронавирус не дал в полной мере оценить все последствия перехода на ЕНВД, однако там завидуют тем, у кого появился шанс еще несколько лет работать на вмененке.

Минфин рассказал о «комфортных» способах перенести отмену ЕНВД :: Экономика :: РБК

Власти обеспечат бизнесу максимально комфортный переход на другие налоговые режимы в связи с отменой с 2021 года Единого налога на вмененный доход (ЕНВД), заверил глава Минфина Антон Силуанов

Антон Силуанов (Фото: Владислав Шатило / РБК)

Переход на более прозрачные налоговые режимы после отмены с 2021 года Единого налога на вмененный доход (ЕНВД) должен пройти для предпринимателей максимально безболезненно, заверил в интервью РБК министр финансов Антон Силуанов.

ЕНВД полностью отменят с 2021 года. В Москве он уже не действует с 2012 года. Ликвидировать ЕНВД по всей России планировали и ранее, но идея вызывала возмущение бизнеса.

После отмены ЕНВД предприниматели могут перейти на упрощенную систему налогообложения (УСН), патентную систему и платить проценты от потенциально возможного годового дохода или же выбрать налог на профессиональный доход (режим для самозанятых), объяснил министр. В первом квартале на сайте ФНС должен появиться калькулятор, который должен помочь предпринимателям выбрать новый наиболее выгодный для себя налоговый режим.

«Надо сделать так, чтобы переход стал для налогоплательщиков абсолютно комфортным, без затрат. Мы сейчас вообще переходим на то, чтобы все налогоплательщики не ходили в Налоговую службу, могли в онлайн-режиме общаться с налоговой», — подчеркнул Силуанов.

ЕНВД — второй популярности у бизнеса налоговый режим. На первом месте — упрощенная система налогообложения (УСН). Сейчас ЕНВД применяют порядка 200 тыс. юрлиц и около 1,8 млн ИП.

«Вмененку» ввели более 20 лет назад, когда государство еще не умело отслеживать доходы малого бизнеса. Сколько бы предприниматель ни заработал, он платит от 7,5 до 15% вмененного дохода (ставку устанавливают власти регионов). Таким образом, фактическая доходность конкретного бизнеса не учитывается. Минфин считает такой режим устаревшим, и его аналогов нет ни в США, ни в ЕС, Китае или Японии.

Тег — отмена ЕНВД

С 1 января власти отменили ЕНВД. Им пользовались в основном самые мелкие предприниматели. Это позволяло им хорошо экономить на налогах. Сейчас им пришлось перейти на патент или «упрощенку». Приводим мнения экспертов по ситуации с отменой данного режима.

Вопросы, которые были заданы экспертам:

  • Как в бизнес-сообществе восприняли отмену ЕНВД? На какой налоговый режим перешло большинство предпринимателей?
  • Есть ли оценки, на сколько в результате этого увеличится их налоговая нагрузка?
  • Кто пострадает от отмены ЕНВД больше всего?
  • Есть ли те, кто решил закрыться или полностью уйти в тень после отмены ЕНВД?
  • Какой, на ваш взгляд, должна быть идеальная налоговая система для микропредпринимателей? Только, пожалуйста, реальные оценки, а не безусловное «освобождение от всех налогов»…
Ответы:

Партия Роста неоднократно выступала за мораторий на отмену Единого налога на вмененный доход до тех пор, пока не возобновится устойчивый экономический рост. Кроме того, на сайте Change.org политики опубликовали петицию: «Сохраните ЕНВД — сохраните малый бизнес в России!». Под документом подписались более 7,5 тысяч человек. В разных регионах России предприниматели поддержали позицию партии флеш-мобами, обклеив торговые точки плакатами «За сохранение ЕНВД». А в августе прошлого года 8 региональных отделений Партии Роста направили письма главам субъектов с просьбой поддержать бизнес в связи с планируемой отменой ЕНВД с 2021 года и, используя право на снижение ставки налога, пересмотреть процентную ставку по УСН и утвердить льготный период налогообложения.

Олег Бурлак — Председатель Регионального отделения Партии роста в Самарской области, врач травматолог-ортопед, учредитель и генеральный директор ООО «ХИМИЯ СИНТЕЗ» (г. Тольятти)

«Исторически сложилось, что любые перемены в налоговом законодательстве воспринимаются предпринимателями с негативом. Люди боятся перемен. В итоге многие перешли либо на УСН, либо на патентную систему, при условии, что это позволяет их вид деятельности. От отмены ЕНВД пострадают и производственники, и торговцы. В Самарской области, как и, думаю, в любом другом регионе, уже есть те, кто не смог приспособиться к новым реалиям и либо ушел в тень, либо просто закрыл бизнес. Однозначно тяжело сказать, какой должна быть идеальная налоговая система для микропредпринимателей, пока ясно только одно: чем она будет проще, тем лучше. Я имею в виду сейчас даже не уровень налоговой нагрузки, а именно взаимоотношения между государством и бизнесом. Если предприниматель будет четко понимать, что с любой прибыли, к примеру, ему нужно будет отдать государству 5 %, то ему на входе легче будет оценить риски, он охотнее будет выполнять взятые на себя обязательства. Сегодня же у нас даже упрощенка в регионах варьируется в разных процентовках».

Нина Литвинова — бизнес-тренер, учредитель сети салонов маникюра и педикюра «Пальчики», член Партии Роста (г. Москва)

«Так как об отмене налога ЕНВД было известно достаточно давно, изначально была довольно сильная негативная реакция, так как многие предприниматели боялись изменения налогового режима и считали, что переход на другой налоговый режим повлечет за собой кардинальный удар по бизнесу. Более того, мы как сообщество бьюти-индустрии писали большое количество писем с просьбой не отменять данный налоговый режим, потому что, особенно для регионов, это было очень актуально. Однако по факту, чем ближе была дата 1 января 2021 года, тем проще становилось отношение предпринимателей, так как, была проведена подробная разъяснительная работа со стороны государства, в отношении того, что есть различные варианты для предпринимателей, более того, были сделаны экономические расчеты. Поэтому очень многие предприниматели увидели, что на деле это все не так страшно и критично.

Какова ситуация сейчас по факту. Многие предприниматели индустрии красоты перешли на патентную систему оплаты налогов, что довольно комфортно для них. Во многих регионах действует льготная ставка по УСН в районе 1%, что тоже позволяет предпринимателям не повышать налоговые отчисления по сравнению с ЕНВД, благодаря чему данный режим воспринимается абсолютно нормально.

Ситуаций, при которых кто-то решил закрыться или полностью уйти в тень после отмены ЕНВД, в массовом порядке мы не наблюдаем. Предприниматели большей частью, еще раз подчеркну, ушли на патент, остальные на УСН по льготным ставкам на текущий момент, поэтому можно констатировать, что переход прошел достаточно комфортно.

С точки зрения идеальной налоговой системы для предпринимателей человекоёмких отраслей, мы уже говорили, что патент и если предприниматель работает на упрощёнке, то сниженная ставка упрощенной системы была бы сейчас большой поддержкой. Уже многие регионы пошли на уступки для указанных отраслей, и в этот кризисный период снизили УСН до 1-2% от оборота, и до 5-6% на разницу доходы минус расходы, вместо 15%. Это существенная поддержка и в принципе это система, которая позволит предпринимателям прожить тяжелый период, особенно, если ее можно было бы закрепить на ближайшие 5 лет. Такой подход был бы большой поддержкой МСП, что в принципе и стоит в приоритетных задачах нашего правительства.

Второе дополнение по поводу налогов — если бы дополнить сокращенную ставку по УСН еще и снижением ставки по социальному налогу — 15% от всей суммы заработной платы, а не только разницы, превышающей МРОТ, это тоже очень сильно бы повлияло на увеличение налоговых отчислений в бюджет и легализацию этой части налогообложения«.

Лариса Невидайло — уполномоченный по правам предпринимателей в Тюменской области, владелец ресторанной сети «Максим», член Генерального совета Партии Роста (г. Тюмень)

«Сказать, что отмену ЕНВД бизнесмены восприняли болезненно — ничего не сказать. Звонки по вопросу продления действия единого налога на вмененный доход от предпринимателей поступали на протяжении многих лет, но именно 2020 год стал рекордным по этому показателю. На предпринимателей обрушились «пандемийные» ограничения, которые, безусловно, снизили доходность, не говоря уже и о тех, кто не смог выдержать барьеров и просто вынужден был закрыться. В конце года предприятия стояли перед выбором, на какую систему налогообложения перейти, и я активно призывала бизнес не затягивать с решением, оценить предстоящие доходы, расходы и определиться, что будет выгоднее. Пока не понятно, какая система оказалась предпочтительнее: ПСН, УСН или НПД, но однозначно могу сказать, что вопросы поступали по всем системам, это связано в первую очередь с теми изменениями, которые вносили как федеральные, так и региональные власти.

Конкретных цифр об увеличении налоговой нагрузки сейчас я бы не называла, но то что у бывших «ЕНВД-шников» в 2021 она увеличится в разы — это точно.

Безусловно, от отмены ЕНВД больше всего пострадают малый и микро бизнес. Больше всего это отразится на так называемом «сельской» рознице и общепите. Всем известно, что такие обязательства как онлайн-кассы, ЕГАИС, обязательная маркировка и меркурий требую дополнительных финансовых и трудовых затрат от бизнеса, поэтому отмена ЕНВД может стать катализатором закрытия бизнеса.

Уверена, что есть такие предприниматели, которые приняли решение уйти в тень или даже закрыться, но в этой негативной тенденции еще сыграла роль пандемия и ее сопутствующие ограничения.

Что же касается идеального режима налогооблажения, я — реалистка и понимаю, что полного освобождения от всех налогов никогда не будет.

Так как под влияние налоговой подпадают и физические лица, и предприятия, и различные фонды, а также абсолютно все сферы бизнеса, в первую очередь налоги должны быть понятными всем. Расчет налогов должен понимать любой человек. Налоговая система Российской Федерации находится в одном ряду со странами, где самые сложные налоговые системы и самые большие налоговые нагрузки, поэтому то, что происходит сейчас со структурой взаимодействия налоговой с налогоплательщиками является безусловным плюсом. Эпоха цифровизации несет не только негатив для предпринимателей, но и, безусловно, упрощает взаимодействие, ведь ко всему новому всегда относятся по-началу скептически».

Наталья Кошелева — вице-президент ассоциации малоформатной торговли РФ, член Партии Роста (г. Новосибирск)

«Конечно, предприниматели надеялись, что режим ЕНВД будет сохранен. Потому что это простой, удобный и всем понятный режим уплаты налогов, который устраивал практически всех бизнесменов. Основная масса предпринимателей, которые заняты в малоформатной торговле, были вынуждены перейти на упрощенный режим налогообложения, так как патентная система, как и режим для самозанятых подходят далеко не для всех. Приведу пример — если предприниматели в ассортименте торгуют товарами, которые подлежат обязательной маркировке, то у них нет возможности перейти на патент. И таких моментов много. Те, кто все же выбрал патент, в массовом порядке заявляют, что уровень налоговой нагрузки на сегодняшний день увеличился для их предприятий в среднем на 30 процентов. Тем не менее, стоит отметить, что патентную систему налогооблажения и режим для самозанятых можно воспринимать как режимы бесшовного перехода с ЕНВД, но тех, кто может выбрать ее — не такое большое количество. Большинство ушли на упрощенку. Оценки есть. При переходе на упрощенку, в 3-10 раз увеличивается налоговая нагрузка, в зависимости от вида деятельности. Но есть и другая проблематика. Существуют два вида УСН: «от доходов» и «доходы минус расходы». Последняя система более выгодна по деньгам, но не все предприниматели готовы усложнять свой налоговый путь. Когда ты переходишь на систему «доходы минус расходы», нужна другая квалификация бухгалтера. Возьмем среднестатистического предпринимателя-регионала, который арендовал на рынке или в торговом помещении пять квадратов и торгует, например, обувью или одеждой. У него нет других наемных сотрудников. Он сам и привозит товар, и торгует, и ведет бухгалтерию. У таких предпринимателей просто нет возможности расширять персонал. Проще платить налог с оборота. Но налоговая нагрузка увеличивается в разы, что ведет к разорению и закрытию некоторых микропредприятий. И в Новосибирской области есть те, кто закрылся. Буквально сейчас нахожусь на мероприятии, где разговаривала сразу с несколькими торговцами, которые приняли решение закрыться. В основном — это представители малоформатной торговли. Что касается тени, проблематика тоже есть. Эта тенденция может усугубиться, особенно в районах области, в связи с увеличением налоговой нагрузки после пандемии.

Еще одна проблема на сегодняшний день, а точнее негативная тенденция — это миграция представителей малого бизнеса по регионам. Многие субъекты приняли решение снизить ставки по УСН при переходе с ЕНВД. Но не все.

Я считаю, что для того, чтобы поддержать экономику сегодня, правительство должно рекомендовать всем без исключения субъектам снизить процентные ставки по УСН до 1 процента. В Новосибирске сейчас это 6%, а значит, налоговая нагрузка для микропредприятий возрастает в 8 раз.

Второе, о чем хотелось бы попросить — это об упрощении самой системы уплаты налогов. К примеру, есть всем понятный режим для самозанятых, нормы которого можно было бы транслировать и на другие режимы.

Отдельно необходимо обратить внимание на наиболее пострадавшие отрасли в период пандемии и таким предпринимателям помочь дополнительно».

Простые методы вменения оказались неадекватными из-за отсутствия неслучайных данных о качестве жизни (MNAR) | Здоровье и качество жизни Результаты

Набор данных

Исследование RECORD было рандомизированным плацебо-контролируемым испытанием ежедневного перорального приема витамина D и кальция для вторичной профилактики переломов, связанных с остеопорозом, у пожилых людей [7]. Качество жизни пациентов оценивали с помощью почтового опроса через 4, 12, 24, 36 и 48 месяцев. Данные за четыре месяца считались «исходным» показателем, поскольку качество жизни многих пациентов при входе в исследование было бы искусственно низким, пока они лечились в больнице по поводу первичного перелома.Анкета включала пять пунктов EuroQoL EQ5D [8] и анкету SF12 из 12 пунктов [9]. EQ5D дает одну оценку QoL, а SF12 дает две сводные оценки: оценку физического и умственного компонентов (PCS и MCS). Результаты для данных EQ5D представлены здесь. В каждом случае, если участник не возвращал анкету в течение двух недель, выдавалось до двух напоминаний (с интервалом в две недели). Пациенты, вернувшие анкету без напоминания, считались «ответившими немедленно», в то время как те, кто вернул анкету после одного или двух напоминаний, предоставили «недостающие, но известные» данные и были названы «респондентами-напоминаниями».В последующем анализе баллы, полученные для лиц, ответивших на напоминания, были расценены как недостающие — каковы были бы в некоторых клинических исследованиях.

Выявление механизма недостающих данных

Проверка гипотез

Образец пропущенных данных можно описать как «конечный», когда за пациентом не проводились дальнейшие наблюдения после набора полных наблюдений, или как «прерывистый», когда случай, когда одно или несколько наблюдений за пациентом отсутствовали до того, как наблюдалось последующее наблюдение.Возможно, у пациента была смешанная картина с периодом прерывистого выбывания, за которым следовало окончательное выпадение.

Существует ряд тестов гипотез, которые могут быть выполнены для проверки предположения MCAR. Литтл [10] разработал тест, основанный на средних значениях интересующей переменной при различных шаблонах отсутствующих данных (включая прерывистое и окончательное отсутствие данных). Альтернативные проверки гипотез были предложены Diggle [11], Ridout [12] и Listing and Schlittgen [13], и все они требовали отсутствия терминала.Diggle [11] использовал подход, который проверяет, является ли подмножество, собирающееся бросить учебу, случайной выборкой из всей совокупности. Ridout [12] применил подход, аналогичный Diggle, используя логистическую регрессию. Листинг и Шлиттген [13] предложили тест, основанный на средних. Эти альтернативы Little [10] будут менее оптимальными в ситуации, когда очевидны периодические пропуски. Ограничение анализа только теми, которые демонстрируют образец отсутствия терминала, приведет к потере информации. Поскольку в записи RECORD периодически отсутствовали данные, для иллюстрации проверки гипотез для MCAR использовался тест Литтла.

Тест Литтла MCAR по сравнению с MAR [10] основан на том, что если данные являются MCAR, то в каждый момент времени рассчитанные средние наблюдаемых данных должны быть одинаковыми, независимо от характера пропущенных данных. Например, не должно иметь значения, соблюдалась ли предыдущая оценка или нет, а также соблюдалась ли предыдущая оценка. Если данные не являются MCAR, средние оценки будут варьироваться в зависимости от модели. Рассмотрим исследование с J измерениями QoL. Пусть P будет количеством различных шаблонов отсутствующих данных ( R i ), где J { p } — количество наблюдаемых переменных. n { p } — количество случаев с шаблоном p th и ∑ n { p } = N . Пусть M { p } будет матрицей J { p } x J индикаторов наблюдаемых переменных в шаблоне P . Матрица имеет одну строку для каждой имеющейся меры, состоящей из (J-1) нулей и одной единицы, идентифицирующей наблюдаемую меру.

Y {р} MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafmywaKLbaebadaahaaWcbeqaaiabcUha7jabdchaWjabc2ha9baaaaa @ 31BE @ является J {р} х 1 вектор средств наблюдаемых переменных для шаблона р , μMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafqiVd0MbaKaaaaa @ 2D9B @ является оценкой максимального правдоподобия (ML) от среднего Y и и ΣMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafyyeIuUbaKaaaaa @ 2D89 @ является оценкой максимального правдоподобия ковариантности Да я .Оценки ML предполагают, что механизм пропущенных данных игнорируется. μ {р} = М {р} μMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafqiVd0MbaKaadaahaaWcbeqaaiabcUha7jabdchaWjabc2ha9baakiabg2da9iabd2eannaaCaaaleqabaGaei4EaSNaemiCaaNaeiyFa0haaOGafqiVd0MbaKaaaaa @ 3ACA @ является J { р } х 1 вектор ML оценкам, соответствующий р -й узор и Σ~ = NN-1М {р} ΣM {р} ‘MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafu4OdmLbaGaacqGH9aqpjuaGdaWcaaqaaiabd6eaobqaaiabd6eaojabgkHiTiabigdaXaaakiabd2eannaaCaaaleqabaGaei4EaSNaemiCaaNaeiyFa0haaOGafu4OdmLbaKaacqWGnbqtdaahaaWcbeqaaiabcUha7jabdchaWjabc2ha9jab cEcaNaaaaaa @ 4123 @ — это соответствующая ковариация J { p } x J { p } , матрица с поправкой на степени свободы.Предлагаемая Литтлом тестовая статистика, когда Σ неизвестна, принимает вид

X2 = ∑p = 1Pn {p} (Y¯ {p} −μˆ {p}) ‘Σ˜ {p} −1 (Y¯ {p} −μˆ {р}). MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xI8qiVKYPFjYdHaVhbbf9v8qqaqFr0xc9vqFj0dXdbba91qpepeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = @ 63CC @

Этот тест статистики асимптотически хи-квадрат с (Σ J } J ) степеней свободы.

Логистическая регрессия

Fairclough [14] описал подход к определению механизма недостающих данных с помощью логистической регрессии. Процесс исследует механизм отсутствия с перекрестной точки зрения, каждый момент времени оценивается по очереди. Те люди, которые не ответили, были исключены из этих анализов. Индикаторная переменная была создана для идентификации тех пациентов, которые отреагировали без напоминания (немедленного реагирования), и тех, которые ответили на напоминания.На первом этапе были определены ковариаты, которые предсказывают возникновение пропущенных наблюдений (напоминание-ответ). Различия между двумя группами по ряду ковариант были исследованы с помощью t-критерия и критериев хи-квадрат. Анализ логистической регрессии использовался для моделирования вероятности пропуска оценки. Идентифицированные ковариаты были введены в модель, а наблюдаемые показатели QoL были проверены на предмет того, вносят ли они вклад в прогнозирование отсутствия [14], на что указывает снижение отклонения (изменение -2 * log правдоподобия).Статистическая значимость этого снижения отклонения оценивалась путем сравнения его с соответствующим распределением хи-квадрат (χ 2 1 ).

Преимущество этого подхода в наших условиях заключалась во включении данных напоминания. Использовалась подмножество данных, содержащих только респондентов. Данные, полученные напоминанием, были признаны недостающими. Первоначально описанный выше процесс проводился для оценки того, были ли ковариаты и наблюдаемое качество жизни значимыми предикторами отсутствия (реакция на напоминание).Поскольку текущие показатели качества жизни были известны, можно было оценить их значимость для прогнозирования отсутствия (напоминание-ответ). Если эти оценки оказались статистически значимыми, процесс предполагает, что данные потенциально были MNAR.

Простое вменение

Методы вменения

В простых методах вменения используется информация от других людей (перекрестная) или информация, относящаяся к человеку, данные о качестве жизни которого отсутствовали (продольный) [15]. Продольные методы включают последнее значение, перенесенное вперед (LVCF), следующее значение, перенесенное в обратном направлении (NVCB), последнее и следующее (LaN — среднее из последнего значения и следующего значения), среднее доступное (Avg), среднее из предыдущего (предыдущее) и среднее будущего (пост).Регрессия также может быть проведена с использованием других наблюдаемых показателей качества жизни (regP) или подходящих ковариат (RegC) или обоих вместе (regP2). Некоторые из этих методов нельзя использовать в любой момент времени, например LaN нельзя использовать для вменения оценок за 48 месяцев, поскольку нет «следующего» значения. Методы поперечного сечения включают в себя вменение среднего значения, регрессию и «горячее» определение (случайный выбор из наблюдаемых). Недостатком методов регрессии является то, что люди с одним и тем же набором ковариат будут иметь идентичное вмененное значение.Это может привести к тому, что дисперсия вмененных данных будет искусственно малой, что приведет к несоответствующим стандартным ошибкам, что приведет к завышению статистики теста и ложно суженным доверительным интервалам и несоответствующим значениям p в любом последующем анализе [14, 15].

Более новый метод, который здесь не рассматривается, — это метод множественного вменения [14]. Эта процедура рассчитывает ряд значений для недостающих данных, включающих как изменчивость измерения QoL, так и неопределенность, связанную с отсутствием наблюдения.Затем каждый набор данных анализируется, а результаты объединяются. Однако в центре внимания данной статьи находится адекватность простого вменения.

Оценка точности методов

Напоминания-ответы были расценены как отсутствующие и рассчитаны с использованием методов, описанных выше. Затем точность этих методов оценивалась путем сравнения вмененных баллов с фактическими наблюдаемыми баллами (респондентов на напоминания) с использованием меры систематической ошибки и пропорциональной дисперсии (PV):

Bias = ∑ (y − yˆ) / mPV = var ( у) / Var (у) MathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xI8qiVKYPFjYdHaVhbbf9v8qqaqFr0xc9vqFj0dXdbba91qpepeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = XFR = xc9adbaqaaeGaciGaaiaabeqaaeqabiWaaaGceaqabeaacqWGcbGqcqWGPbqAcqWGHbqycqWGZbWCcqGH9aqpdaaeabqaamaabmaabaGaemyEaKNaeyOeI0IafmyEaKNbaKaaaiaawIcacaGLPaaaaSqabeqaniabggHiLdGccqGGVaWlcqWGTbqBaeaacqWGqbaucqWGwbGvcqGH9aqpcyGG2bGDcqGGHbqycqGGYbGCdaqadaqaaiqbdMha5zaajaaacaGLOaGaayzkaaGaei4la8IagiODayNaeiyyaeMaeiOCai3aaeWaaeaacqWG5bqEaiaawIcacaGLPaaaaaaa @ 4EEF @

Где yMathType @ СПР @ 5 @ 5 + = feaagaart1ev2aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacPC6xNi = xH8viVGI8Gi = hEeeu0xXdbba9frFj0xb9qqpG0dXdb9aspeI8k8fiI + FSY = rqGqVepae9pg0db9vqaiVgFr0xfr = xfr = xc9ad baqaaeGaciGaaiaabeqaaeqabiWaaaGcbaGafmyEaKNbaKaaaaa @ 2D60 @ — это вмененное значение, y — фактическое значение, а m — количество пропущенных значений.Положительное отклонение указывает на то, что в среднем вмененное значение занижает истинное значение QoL. PV представляет собой отношение наблюдаемой дисперсии к истинной дисперсии и оценивает недостаточную дисперсию для каждого метода. Значение PV , равное единице, указывает, что дисперсия вмененных значений равна дисперсии истинных значений. Значение PV меньше единицы означает недооценку истинной дисперсии. Систематическая ошибка и PV были рассчитаны для каждого пациента, а затем было взято среднее значение для всех пациентов.Для получения доверительных интервалов (ДИ) для каждой из оценок точности в статистическом пакете STATA использовалась методика начальной загрузки [16].

Метод вменения — обзор

2.10.4 Онлайн-прогнозирование будущих траекторий и окончательное качество

Во многих ситуациях во время производства партии человек заинтересован в прогнозировании будущего поведения траекторий партии и качества конечного продукта. В частности, они представляют интерес для мониторинга и управления процессами (см. Разделы 2.10.5 и 2.10.6). В этом разделе мы представляем основные идеи и методы для этих прогнозов.

Цель состоит в том, чтобы предоставить прогнозы в течение новой партии. Следовательно, требуются модели скрытых переменных с BWU, то есть подходы либо BWU, либо OWU – TBWU. Они моделируют динамические изменяющиеся во времени траектории и конечное качество каждой партии. Здесь мы будем рассматривать только модели PLS, хотя, если есть интерес только в прогнозировании будущих траекторий переменных процесса, можно использовать модели BWU PCA.Однако метод тот же. Мы предполагаем, что модель BWU PLS, использующая данные Z , X или T OWU и Y , уже была построена из репрезентативного набора данных исторических партий.

Основная проблема в прогнозировании качества конечной партии с использованием любого подхода BWU, когда в настоящий момент в момент времени k во время новой партии, заключается в том, что данные траектории по всем будущим переменным от времени k + 1 до конечного время замеса К отсутствуют.Баллы ( t 1 , t 2 ,…) и качество конечного продукта ( Y ) для любой партии из модели BWU PLS являются функциями всех переменных на протяжении всей истории партии. Следовательно, следует использовать пакетную модель для условного исчисления (прогнозирования) оставшихся траекторий всех переменных, а затем на основе этих условных значений можно рассчитать баллы и окончательный прогноз качества.

Существует множество подходов для вменения траекторий недостающих переменных за оставшийся период в партии.За исключением нескольких специальных подходов, которые делают довольно сильные предположения (например, предполагают, что будущие траектории будут просто средними траекториями, заполнение нулями или сохранение текущих отклонений для оставшейся части партии), все методы основаны на о методах вменения недостающих данных для моделей PCA и PLS. 14,15 Номикос и МакГрегор 6–8 использовали и рекомендовали подход проекции на модельную плоскость (PMP) в своей ранней работе, но недавние исследования показали, что условная замена среднего (CMR) или усеченная регрессия оценки (TSR) подходы могут быть лучше 15 в определенных случаях.В этой главе мы представляем и проиллюстрируем только подход PMP, поэтому читатели могут обратиться к литературе по другим алгоритмам.

Предположим, что во время новой партии мы в настоящее время находимся в момент времени k и наблюдали траектории для переменных процесса J до этого времени (т. Е. x новый, 1: кДж T ). Задача состоит в том, чтобы вменять траектории отсутствующих данных для оставшейся части партии, предполагая, что они соответствуют уже наблюдаемым значениям до времени k ( x новое, 1: кДж T ) и ковариационная структура модели PCA или PLS для оставшейся части партии.Путем разбиения полного вектора-строки x новый T = ( x новый, 1: кДж T x новый, ( k +1) J : KJ T ) на известные и неизвестные части и, соответственно, разделив матрицы нагрузки и веса PCA / PLS, можно показать 16 , что оценка методом наименьших квадратов строки вектора оценок 1 × A τ новый T для новой партии, на основе информации до времени k , с использованием PMP, задается как

(2) τˆnew, k = (P1: kJTP1: kJ) −1P1: kJTxnew, 1: kJ

Изменяющаяся во времени ковариационная структура полного пакета может быть разделена как

(3) xnewT = [xnew, 1: kJT; xnew, (k + 1) J: KJT] = τnewT [P1: kJT; P ( k + 1) J: KJT]

и оценка оставшихся данных траектории, которая согласуется с моделью и историей текущей партии ( x новых, 1: кДж T ) дан Гарсия-Муньос и др. .: 16

(4) xnew, (k + 1) J: KJT = τˆnewTP (k + 1) J: KJT

Эти условно рассчитанные траектории будущих пакетов сильно отличаются от простых линейных многомерных прогнозов временных рядов, основанных на прошлых данных. . 16 Они включают в себя все прошлые данные до времени k , но, кроме того, они используют известные изменяющиеся во времени матрицы веса и нагрузки на будущий горизонт до конца пакета, чтобы делать прогнозы на будущее. В этом смысле вменения представляют собой скорее интерполяцию, чем экстраполяцию, и они обладают высокой степенью адаптивности по мере появления новых данных.

Данные о периодической полимеризации нейлона используются здесь, чтобы проиллюстрировать точные, нелинейные, изменяющиеся во времени прогнозы будущей траектории, которые могут быть получены. Модель PCA на матрице BWU из 10 переменных была построена со всеми пакетами, за исключением некоторых пакетов с выбросами (37, 39, 43–55) и пакета, используемого для иллюстрации прогнозов траектории, пакета 22. Учитывая данные, доступные для всех. переменные до времени 30, На рисунке 21 показаны прогнозы, сделанные для оставшейся части немоделированного пакета для ( k = 31,…, 100) для одной из переменных.Аналогичные прогнозы доступны и для других траекторий. На одном графике показаны полные прогнозы траектории со средней траекторией, добавленной к прогнозам отклонения, а на другом графике показаны будущие прогнозы только переменных отклонений от среднего. Очевидно, что раннее поведение измеренных траекторий и изменяющиеся во времени нагрузки используются для обеспечения очень точных прогнозов будущих отклонений траекторий.

Рисунок 21. (a) Прогнозы траектории от до = 30 и далее в исходных единицах переменной.(b) Прогнозы переменной от до = 30 и далее, но показаны как отклонения от средней траектории.

Прогноз, сделанный во время k , для вектора качества конечного продукта для новой партии (в момент времени K ) затем дается следующим образом:

(5) yˆT = τnewTC

Это позволяет предоставлять обновленные онлайн-прогнозы качества конечного продукта по мере производства партии. 8 Аналогичный подход можно использовать для прогнозирования конечной конечной точки (время сбора урожая и т. Д.).) для достижения наилучшего качества. 17 Эти прогнозы будут важной частью задач пакетного мониторинга, управления и оптимизации, обсуждаемых в следующих разделах.

Альтернативный подход — построить отдельные модели PLS BWU (или TBWU) для разной степени завершения партии (например, 50, 75 и 90%), а затем спрогнозировать качество конечного продукта, когда каждая из этих моделей будет иметь полные данные. (например, в точках завершения 50, 75 и 90%). Однако этот поэтапный подход с фиксированной моделью редко бывает таким же эффективным, как использование полной модели BWU с отсутствующими вмененными данными.Поэтапный подход не использует информацию об изменении структуры загрузки для оставшейся части партии и, следовательно, не может также предсказать, как нарушения, очевидные в ранней части партии, будут распространяться по оставшейся части партии. Напротив, полная модель BWU обладает этими знаниями при условии, что она основана на репрезентативных данных.

Вменение отсутствующих данных: упор на единичное вменение

Ann Transl Med. 2016 Янв; 4 (1): 9.

Отделение интенсивной терапии, Центральная городская больница Цзиньхуа, Больница Цзиньхуа Университета Чжэцзян, Цзиньхуа 321000, Китай

Автор, отвечающий за переписку.

Поступило 18 ноября 2015 г .; Принято 8 декабря 2015 г.

Copyright 2016 Annals of Translational Medicine. Все права защищены.Эта статья цитировалась в других статьях в PMC.

Abstract

Полный анализ случая широко используется для обработки недостающих данных и является методом по умолчанию во многих статистических пакетах. Однако этот метод может внести систематическую ошибку, и некоторая полезная информация будет исключена из анализа. Поэтому для восполнения пробела разработано множество методов вменения. В данной статье основное внимание уделяется единовременному вменению.Расчет со средним, медианным и модой прост, но, как и полный анализ случая, может привести к смещению среднего и отклонения. Кроме того, они игнорируют взаимосвязь с другими переменными. Вменение регрессии может сохранить связь между пропущенными значениями и другими переменными. Существует множество сложных методов обработки пропущенных значений в лонгитюдных данных. В этой статье основное внимание уделяется тому, как реализовать код R для выполнения единственного вменения, избегая при этом сложных математических вычислений.

Ключевые слова: Клиническое испытание с большими данными, отсутствующие данные, единичное вменение, продольные данные, R

Введение

Отсутствующие данные являются повсеместным явлением в клинических испытаниях с большими данными. Хотя во многих исследованиях явно не сообщается, как они обрабатывают недостающие данные (1,2), некоторые неявные методы используются в статистическом программном обеспечении. В результате разные пакеты могут обрабатывать отсутствующие данные по-разному (или методы по умолчанию разные), и результаты могут не воспроизводиться в точности с использованием разных пакетов статистического программного обеспечения.Иногда это может не привести к существенно разным результатам, но это ставит под сомнение научную обоснованность исследования. Лучше всего явно указать, как обрабатываются пропущенные значения. Для простоты многие исследователи просто удаляют неполный случай (удаление по списку), что также является методом по умолчанию во многих пакетах регрессии (3). Этот метод дает надежные результаты только в том случае, если количество пропущенных значений невелико, а отсутствующий шаблон отсутствует полностью случайным образом (MCAR) или отсутствует MAR.Еще один недостаток полного анализа дела — потеря информации. Это может стать большой проблемой при большом количестве переменных (столбцов). Значительное количество наблюдений можно удалить, поскольку удаление основано на отсутствии одной или нескольких переменных. Кроме того, полный анализ случая может привести к непредсказуемой систематической ошибке (3-5). Решение этой проблемы — вменение. Отсутствующие значения заменяются вмененными значениями. Поскольку вменение является областью активных исследований, существует множество методов и пакетов, разработанных для вменения.В этой статье представлены некоторые основные методы вменения недостающих данных. Множественные вменения будут обсуждаться в следующих статьях серии клинических испытаний с большими данными.

Моделирование набора данных

Набор данных из 150 наблюдений создается путем моделирования. Набор данных используется для иллюстрации и не имеет клинического значения. Есть три переменных, включая пол, среднее артериальное давление (карта) и лактат (lac). В каждой симуляции я устанавливаю начальное число, чтобы читатели могли воспроизвести результаты.

В наборе данных создается lac для корреляции с картой. Лактат сыворотки является отражением тканевой перфузии, которая зависит от среднего артериального давления. Для связи map ~ lac предполагается отрицательный коэффициент корреляции. Чтобы добавить шум, перехват создается с помощью генератора случайных чисел [функция rnorm ()]. Секс создается в предположении MCAR.

В переменной lac пропущено 47 значений. Стандартное отклонение — 1.11, а среднее — 2,051.

— диаграмма разброса lac по сравнению с картой, а пропущенные значения на lac обозначены красным треугольником. Черные и красные кривые аппроксимированы сглаженной непараметрической регрессией для непропущенных и пропущенных значений соответственно. Следует отметить, что пропущенные значения на lac распределяются равномерно по диапазону lac и не зависят от карты переменных. Это соответствует MCAR.

График рассеяния lac и . карта и пропущенные значения на lac обозначены красным треугольником.

Грубая оценка пропущенных значений с помощью среднего, моды или медианы

Быстрый подход к отсутствующим значениям — заменить их средним, медианным или модой. Для этой цели можно использовать функцию initialise (), поставляемую с пакетом VIM. Однако он в основном используется внутри некоторых алгоритмов вменения и не имеет преимуществ перед другими базовыми методами при выполнении простого вменения. Предположим, мы хотим вменять отсутствующие значения в данных по среднему значению для числовых переменных и по режиму для категориальных переменных.

Затем вы можете посмотреть, как вмененные значения заполняют диаграмму рассеяния lac ~ map.

Следует отметить, что все условные значения соответствуют среднему значению lac 2,1 ммоль / л (). Среднее значение и стандартное отклонение смещены. Расчеты с модой и медианной работают одинаково, и они оставлены читателям для практики. Хотя грубое вменение обеспечивает быстрые и простые методы поиска пропущенных значений, оно недооценивает дисперсию, ставит под угрозу взаимосвязь между переменными и искажает сводную статистику.Таким образом, грубые условные исчисления могут использоваться только в том случае, если несколько значений отсутствуют, они не предназначены для общего использования.

График рассеяния lac и . карта с пропущенными значениями lac, замененными средним значением наблюдаемого lac.

Регрессионное вменение

Вменение с регрессией для другой одной или нескольких переменных может дать более разумные значения. Во-первых, исследователям необходимо подобрать регрессионную модель, задав интересующую переменную в качестве переменной отклика, а другую соответствующую переменную — в качестве ковариат.Коэффициенты оцениваются, а затем пропущенные значения могут быть предсказаны с помощью подобранной модели. Возьмем, к примеру, набор данных, можно построить модель линейной регрессии между lac и map. После этого пропущенные значения lac можно предсказать с помощью уравнения подобранной модели.

Расчетные значения находятся на линии регрессии без шума (). Это выглядит более рациональным, чем оценка со средним значением. Однако этот метод увеличивает коэффициенты корреляции между map и lac. Недооценивается изменчивость условно исчисленных данных.В качестве альтернативы вы можете добавить немного шума к регрессии, используя функцию mice () (6).

График рассеяния lac и . карта с отсутствующими значениями на lac, замененными значениями, предсказанными подобранной регрессионной моделью.

Ядром функции mice () является аргумент method = «norm.nob», который сначала оценивает наклон, точку пересечения и остаточную дисперсию с помощью линейной регрессии, а затем предсказывает пропущенные значения с этими спецификациями. Добавление остаточной дисперсии открывает распределение вмененных значений (например,g., они не попадают в линию регрессии) (). Однако ограничение состоит в том, что одно условное значение падает ниже нуля, что практически невозможно.

Отсутствующие значения предсказываются линейной регрессией. Обратите внимание, что остаточная дисперсия добавляется, чтобы отразить неопределенность в оценке.

Индикаторный метод

Индикаторный метод является альтернативой работе с пропущенными значениями. Этот метод заменяет отсутствующие данные на ноль, и его можно легко сделать, изменив предыдущий код R. Я оставляю это твоей практике.Индикаторный метод когда-то был популярен, потому что он прост и сохраняет полный набор данных. С другой стороны, это позволяет систематически различать наблюдаемые и ненаблюдаемые данные. Однако индикаторный метод критикуют за то, что он может внести непредсказуемую систематическую ошибку в регрессионную модель даже при небольшом проценте пропущенных значений (4). Некоторые авторы выступают против его использования в общей практике (7).

Импутация продольных данных

Функция imputation (), поставляемая с пакетом продольных данных, обеспечивает мощный алгоритм для вменения продольных данных (8).Продольные данные характеризуются корреляцией между повторными измерениями определенной переменной. Таким образом, пропущенные значения, вмененные в зависимости от соседних значений, более надежны, чем методы, упомянутые выше. Например, для данного пациента его или ее уровни лактата в сыворотке коррелируют в последовательных измерениях.

Предположим, у нас есть четыре пациента, и уровень лактата в сыворотке измеряется ежедневно. Однако есть много недостающих значений. Код R для создания набора данных показан ниже.

Первым шагом в анализе такого набора данных является оценка недостающих значений. Поскольку это продольные данные, разумно, чтобы пропущенные значения коррелировали с их непосредственными наблюдаемыми значениями. Однако существует множество методов вменения. При продольном вменении используются не пропущенные данные одного и того же объекта для оценки пропущенных значений. Вменение не зависит от других отдельных субъектов или случаев. Существуют также различные методы продольного вменения () (9-11).В данной статье я хочу проиллюстрировать несколько простых методов условного исчисления продольных данных. Читатели, интересующиеся более сложными методами, могут найти ссылку (9).

Таблица 1

Методы вменения для продольных данных

Заменить среднее значение в это время 34 34
Методы вменения Краткое описание
Вменение поперечного сечения
Заменить среднее значение 904 на среднее значение
Перекрестная медиана Заменить пропущенное значение на медианное значение наблюдаемых в то время
Cross hot deck Заменить отсутствующее значение случайно выбранным значением среди значений, наблюдаемых в то время
Продольное вменение
Среднее значение траджа Заменить отсутствующее значение средними значениями этого объекта (траектория)
Медиана Траджа Заменить пропущенное значение медианным значением этого объекта (траектория)
Traj hot deck отсутствующее значение b ya значение, выбранное случайным образом из этого объекта (траектория)
LOCF Заменить отсутствующее значение предыдущим неотсутствующим значением этого объекта (траектория)
Линейная интерполяция Значения, непосредственно окружающие отсутствующее, соединяются линией
Сплайн-интерполяция Значения, непосредственно окружающие отсутствующее, объединяются кубическим сплайном
Поперечное и продольное вменение
Скопировать среднее Объединить линейную интерполяцию и вменение37 с использованием средней траектории совокупности
Прогнозирование недостающего значения путем построения модели

Функция par () очень эффективна при настройке графических параметров R.Аргумент mfrow = c (2,2) указывает, что последующие рисунки будут отображаться в виде массива два на два на устройстве по строкам. Чтобы проиллюстрировать, как работает каждый метод вменения, я нанес на график наблюдаемые и рассчитанные измерения лактата с помощью функции matplot (). Методы вменения выполняются функцией imputation (). Первый аргумент указывает матрицу траектории для вменения. Второй аргумент указывает имя метода вменения. В примере я использовал crossMean, trajMean, linearInterpol.locf »и« copyMean.locf ». Различные методы привели к разным условным значениям (). Чтобы отличить наблюдаемые значения от условно рассчитанных, использовалась функция matlines (), чтобы выделить наблюдаемые значения красными точками и линиями.

Продольные вменения разными методами.

Резюме

Отсутствующие данные являются повсеместным явлением в клинических испытаниях с большими данными. Некоторые исследователи используют метод полного анализа случая, и с его помощью можно получить надежные результаты, когда пропущенные значения случайны и их доля невелика.Однако часто бывает, что полный анализ случая приводит к потере информации при наличии большого количества переменных. Вменение — альтернатива, которая может помочь получить надежные результаты. В этой статье представлены некоторые простые методы вменения. Вменения среднего, медианы и моды просты, но они недооценивают дисперсию и игнорируют взаимосвязь с другими переменными. Метод регрессии может сохранить их корреляцию с другими переменными, но изменчивость пропущенных значений недооценивается. Вариабельность можно регулировать, добавляя случайные ошибки в регрессионную модель.Индикаторный метод заключается в замене отсутствующих значений нулями, что не рекомендуется для общего использования. Лонгитюдные данные являются особенными, и существует множество методов вменения. Это область активных исследований, и остается спорным, какой метод лучше. Основываясь на имитационном исследовании, хорошим выбором может быть метод среднего копирования (9).

Биография

Введение автора : Zhongheng Zhang, MMed. Отделение интенсивной терапии, Центральная городская больница Цзиньхуа, Больница Цзиньхуа Университета Чжэцзян.Доктор Чжунхэн Чжан — другой врач в городской центральной больнице Цзиньхуа. В 2009 году он окончил медицинский факультет Чжэцзянского университета, получив степень магистра. Он опубликовал более 35 научных работ (проиндексированных с научным цитированием), которые цитировались более 200 раз. Он был назначен рецензентом 10 журналов, в том числе Journal of Cardiovascular Medicine , Hemodialysis International , Journal of Translational Medicine , Critical Care , International Journal of Clinical Practice , Journal of Critical Care .Его основные научные интересы включают мониторинг гемодинамики при сепсисе и септическом шоке, делирии и изучение исходов для тяжелобольных пациентов. Он имеет опыт управления данными и статистического анализа с использованием R и STATA, исследования больших данных, систематического обзора и метаанализа.

Сноски

Конфликт интересов: У автора нет конфликта интересов, о котором следует заявлять.

Ссылки

1. Wood AM, White IR, Thompson SG. Адекватно ли обрабатываются недостающие данные о результатах? Обзор опубликованных рандомизированных контролируемых исследований в крупных медицинских журналах.Клинические испытания 2004; 1: 368-76. [PubMed] [Google Scholar] 2. Белл М.Л., Фиеро М., Хортон Нью-Джерси и др. Обработка недостающих данных в РКИ; обзор ведущих медицинских журналов. BMC Med Res Methodol 2014; 14: 118. [Бесплатная статья PMC] [PubMed] [Google Scholar] 3. Демисси С., депутат ЛаВэлли, Хортон, штат Нью-Джерси, и др. Смещение из-за отсутствия данных о воздействии с использованием анализа полного случая в модели регрессии пропорциональных рисков. Stat Med 2003; 22: 545-57. [PubMed] [Google Scholar] 4. Knol MJ, Janssen KJ, Donders AR и др. Непредсказуемая систематическая ошибка при использовании метода отсутствующих показателей или полного анализа случаев отсутствия искажающих значений: эмпирический пример.J Clin Epidemiol 2010; 63: 728-36. [PubMed] [Google Scholar] 5. Masconi KL, Matsha TE, Erasmus RT и др. Влияние различных методов вменения недостающих данных на эффективность моделей прогнозирования недиагностированного риска диабета среди населения Южной Африки со смешанным происхождением. PLoS One 2015; 10: e0139210. [Бесплатная статья PMC] [PubMed] [Google Scholar] 6. Бюрен С.В., Гротуис-Оудсхорн К. мышей: многомерное вычисление цепными уравнениями в R. Журнал статистического программного обеспечения 2011; 45: 1-67. [Google Scholar] 7.van der Heijden GJ, Donders AR, Stijnen T. и др. Вменение пропущенных значений превосходит полный анализ случая и метод недостающего индикатора в многомерном диагностическом исследовании: клинический пример. J Clin Epidemiol 2006; 59: 1102-9. [PubMed] [Google Scholar] 9. Дженолини К., Экошар Р., Жакмин-Гадда Х. Копировать среднее: новый метод вменения периодически отсутствующих значений в лонгитюдных исследованиях. Открытый статистический журнал 2013; 3: 26-40. [Google Scholar] 10. Твиск Дж., Де Венте В. Истощение в лонгитюдных исследованиях.Как работать с недостающими данными. J Clin Epidemiol 2002; 55: 329-37. [PubMed] [Google Scholar] 11. Энгельс Дж. М., Дир П. Вменение отсутствующих продольных данных: сравнение методов. J Clin Epidemiol 2003; 56: 968-76. [PubMed] [Google Scholar] Учебное пособие по

: Введение в вменение отсутствующих данных | by Cambridge Spark

Существуют и другие более продвинутые методы, сочетающие идеи основных методов, которые мы обсуждали выше. Согласование с прогнозируемым средним значением , например, сочетает в себе идею вменения на основе модели (вменение регрессии) и на основе соседства (вменение KNN).Во-первых, прогнозируемое значение целевой переменной Y вычисляется в соответствии с указанной моделью, и небольшой набор кандидатов в доноры (например, 3, 5) выбирается из полных случаев, у которых Y близко к прогнозируемому значению. Затем проводится случайная жеребьевка среди кандидатов, и наблюдаемое значение Y выбранного донора используется для замены отсутствующего значения.

Множественное вменение

Среднее значение, медиана, вменение режима, вменение регрессии, вменение стохастической регрессии, вменение KNN — все это методы, которые создают одно значение замены для каждой отсутствующей записи. Множественное вменение (MI) , а не другой метод, больше похож на общий подход / структуру многократного выполнения процедуры вменения для создания различных правдоподобных вмененных наборов данных. Ключевым мотивом для использования MI является то, что единичное вменение не может отражать изменчивость выборки как из выборочных данных, так и из отсутствующих значений.

Подробнее о философии множественного вменения можно прочитать в [5]. Таким образом, МИ разбивает задачу вывода на три этапа: условное исчисление, анализ и объединение .Вменение и анализ может выполняться как обычно, как и в стандартном анализе, но объединение должно выполняться в соответствии с правилом Рубина (подробности см. [6]). Короче говоря, правило Рубина дает формулу для оценки общей дисперсии, которая состоит из дисперсии в пределах вменения и дисперсии между вменениями.

Доступно множество алгоритмов и реализаций MI. Одна из самых популярных — это MICE (многомерное вменение посредством связанных уравнений) (см. [2]), а реализация python доступна в пакете fancyimpute.

Сводка

В этом руководстве мы обсудили некоторые основные методы заполнения пропущенных значений. Эти методы обычно разумно использовать, когда механизмом данных является MCAR или MAR.

Однако при принятии решения о том, как вменять отсутствующие значения на практике, важно учитывать:

  • контекст данных
  • количество отсутствующих данных
  • механизм отсутствующих данных

Например, если все значения ниже / выше порогового значения переменной отсутствуют (пример NMAR), ни один из методов не будет приписывать значения, аналогичные истинным.В этом конкретном случае модель выбора Хекмана больше подходит для использования (подробнее см. [4]).

[1] Эллисон, Пол Д. Данные отсутствуют. Vol. 136. Публикации Sage, 2001.

[2] Azur, Melissa J., et al. «Множественное вменение посредством связанных уравнений: что это такое и как это работает?». Международный журнал методов психиатрических исследований 20.1 (2011): 40–49.

[3] Гельман, Эндрю и Дженнифер Хилл. Анализ данных с использованием регрессионных и многоуровневых / иерархических моделей.Издательство Кембриджского университета, 2006 г., глава 15: http://www.stat.columbia.edu/~gelman/arm/missing.pdf.

[4] Хекман, Джеймс Дж. «Общая структура статистических моделей усечения, выборки и ограниченных зависимых переменных, а также простая оценка для таких моделей». Анналы экономических и социальных измерений, Том 5, номер 4. NBER, 1976. 475–492.

[5] Литтл, Родерик Дж. А. и Дональд Б. Рубин. Статистический анализ с отсутствующими данными. Vol. 793. Джон Вили и сыновья, 2014.

[6] Рубин, Дональд Б. «Вывод и недостающие данные». Биометрика 63.3 (1976): 581–592.

[7] Ван Бюрен, Стеф. Гибкое вменение недостающих данных. Chapman and Hall / CRC, 2018

6 различных способов компенсации недостающих значений в наборе данных (расчет данных с примерами) | Уилл Бадр

Популярные стратегии статистического вменения пропущенных значений в набор данных.

Многие реальные наборы данных могут содержать пропущенные значения по разным причинам. Они часто кодируются как NaN, пробелы или любые другие заполнители.Обучение модели с набором данных, в котором много пропущенных значений, может существенно повлиять на качество модели машинного обучения. Некоторые алгоритмы, такие как оценщики scikit-learn , предполагают, что все значения являются числовыми и имеют и удерживают значимое значение.

Один из способов решения этой проблемы — избавиться от наблюдений, в которых отсутствуют данные. Однако вы рискуете потерять точки данных с ценной информацией. Лучшей стратегией было бы вменять недостающие значения. Другими словами, нам нужно вывести эти недостающие значения из существующей части данных.Существует три основных типа отсутствующих данных:

  • Отсутствуют случайно (MCAR)
  • Случайно отсутствуют (MAR)
  • Отсутствуют случайно (NMAR)

Однако в этой статье я сосредоточусь на 6 популярные способы вменения данных для наборов перекрестных данных (набор данных временных рядов — это совсем другая история).

Это несложно. Вы просто позволяете алгоритму обрабатывать недостающие данные. Некоторые алгоритмы могут учитывать недостающие значения и определять наилучшие значения вменения для недостающих данных на основе уменьшения потерь при обучении (т. Е.XGBoost). У некоторых других есть возможность просто игнорировать их (например, LightGBM — use_missing = false ). Однако другие алгоритмы будут паниковать и выдавать ошибку, жалуясь на отсутствующие значения (например, Scikit learn — LinearRegression). В этом случае вам нужно будет обработать недостающие данные и очистить их, прежде чем передать их алгоритму.

Давайте посмотрим, как еще можно вменять недостающие значения перед обучением:

Примечание. Во всех приведенных ниже примерах используется набор данных California Housing от Scikit-learn.

Это работает путем вычисления среднего / медианного значения не пропущенных значений в столбце с последующей заменой отсутствующих значений в каждом столбце отдельно и независимо от других. Его можно использовать только с числовыми данными.

Среднее значение

Плюсы:

  • Легко и быстро.
  • Хорошо работает с небольшими наборами числовых данных.

Минусы :

  • Не учитывает корреляции между функциями. Это работает только на уровне столбца.
  • Будет давать плохие результаты для закодированных категориальных функций (НЕ используйте это для категориальных функций).
  • Не очень точно.
  • Не учитывает неопределенность в расчетах.
Среднее / Медианное вменение

Наиболее частое — это другая статистическая стратегия для вменения пропущенных значений и ДА !! Он работает с категориальными функциями (строками или числовыми представлениями), заменяя отсутствующие данные наиболее частыми значениями в каждом столбце.

Плюсы:

  • Хорошо работает с категориальными функциями.

Минусы:

  • Также не учитываются корреляции между функциями.
  • Это может внести систематическую ошибку в данные.
Наиболее частое вменение

Нулевое или постоянное вменение — как следует из названия — заменяет отсутствующие значения либо нулем, либо любым заданным вами постоянным значением

k ближайших соседей — это алгоритм, который используется для простой классификации.Алгоритм использует « сходство признаков » для прогнозирования значений любых новых точек данных. Это означает, что новой точке присваивается значение в зависимости от того, насколько она похожа на точки в обучающем наборе. Это может быть очень полезно при прогнозировании пропущенных значений путем нахождения k из ближайших соседей к наблюдению с отсутствующими данными и последующего вменения их на основе не пропущенных значений в окрестности. Давайте посмотрим на пример кода с использованием библиотеки Impyute , которая обеспечивает простой и легкий способ использования KNN для вменения:

KNN Imputation для California Housing Dataset

Как это работает?

Он создает базовое среднее значение, а затем использует полученный полный список для построения KDTree.Затем он использует полученное KDTree для вычисления ближайших соседей (NN). После того, как он находит k-NN, он берет их средневзвешенное значение.

Плюсы:

  • Может быть намного точнее, чем методы среднего, медианного или наиболее частого вменения (это зависит от набора данных).

Минусы:

  • С точки зрения вычислений. KNN работает, сохраняя в памяти весь обучающий набор данных.
  • K-NN весьма чувствителен к выбросам в данных ( в отличие от SVM )
Основные шаги, используемые при множественном вменении [1]

Этот тип вменения работает путем многократного заполнения недостающих данных.Множественные вменения (MI) намного лучше, чем одиночные вменения, поскольку они лучше измеряют неопределенность пропущенных значений. Подход с использованием цепных уравнений также очень гибок и может обрабатывать различные переменные с разными типами данных (т. Е. Непрерывными или двоичными), а также со сложностями, такими как границы или шаблоны пропусков опроса. Для получения дополнительной информации о механике алгоритма вы можете обратиться к исследовательской статье

MICE вменение с использованием импьюта

. Этот метод очень хорошо работает с категориальными и нечисловыми функциями.Это библиотека, которая изучает модели машинного обучения с использованием глубоких нейронных сетей для вменения отсутствующих значений в фрейм данных. Он также поддерживает как CPU, так и GPU для обучения.

Расчет с использованием Datawig

Pros :

  • Достаточно точный по сравнению с другими методами.
  • Он имеет некоторые функции, которые могут обрабатывать категориальные данные (Feature Encoder).
  • Он поддерживает процессоры и графические процессоры.

Минусы:

  • Одностолбцовый условный расчет.
  • Может работать довольно медленно с большими наборами данных.
  • Вы должны указать столбцы, содержащие информацию о целевом столбце, который будет вменяться.

Вменение стохастической регрессии:

Это очень похоже на вменение регрессии, которое пытается предсказать пропущенные значения, регрессируя их из других связанных переменных в том же наборе данных плюс некоторая случайная остаточная величина.

Экстраполяция и интерполяция:

Он пытается оценить значения из других наблюдений в диапазоне дискретного набора известных точек данных.

Вменение Hot-Deck:

Работает путем случайного выбора отсутствующего значения из набора связанных и похожих переменных.

В заключение, не существует идеального способа компенсировать недостающие значения в наборе данных. Каждая стратегия может работать лучше для определенных наборов данных и отсутствующих типов данных, но может работать намного хуже для других типов наборов данных. Существует несколько установленных правил, позволяющих решить, какую стратегию использовать для определенных типов пропущенных значений, но помимо этого вам следует поэкспериментировать и проверить, какая модель лучше всего подходит для вашего набора данных.

Ссылки:

Множественное вложение для отсутствующих данных: определение, обзор

Определения статистики>

Множественное вменение (MI) — это способ справиться с систематической ошибкой, связанной с неполучением ответов, — отсутствием данных исследования, которое происходит, когда люди не отвечают на опрос. Этот метод позволяет анализировать неполные данные с помощью обычных инструментов анализа данных, таких как t-тест или ANOVA. Вменять означает «заполнить». При использовании единичных методов вменения для вменения пропущенных значений используется среднее значение, медиана или другие статистические данные.Однако использование единичных значений влечет за собой уровень неопределенности в отношении того, какие значения следует приписать. Множественное вменение сужает неопределенность в отношении пропущенных значений за счет расчета нескольких различных вариантов («вменений»). Создается несколько версий одного и того же набора данных, которые затем объединяются для получения «лучших» значений.


Преимущества множественного вложения

При правильном использовании MI может:


  • Уменьшить смещение . «Предвзятость» относится к ошибкам, которые закрадываются в ваш анализ.
  • Повысить достоверность. Действительность просто означает, что тест или прибор точно измеряют то, что должны. Например, когда вы создаете тест или анкету на депрессию, вы хотите, чтобы вопросы действительно измеряли депрессию, а не что-то еще (например, тревогу).
  • Повышение точности. Точность — это насколько близко друг к другу находятся два или более измерения.
  • Результат: надежных статистических данных , устойчивых к выбросам (очень высокие или очень низкие точки данных).

Расчет условных обозначений

При использовании метода множественного вменения отсутствующие значения заменяются вариантами m> 1, где m обычно <10.

В этой таблице отсутствуют значения данных для Y2 и Y4.

Общая, очень упрощенная процедура (как указано Рубином, 1987) представляет собой серию шагов:

  1. Подгоните свои данные к соответствующей модели . Подбор модели берет данные из выборок и пытается найти наиболее подходящую модель, например нормальное распределение или распределение хи-квадрат.Модель также может быть другой параметрической моделью, полученной из ваших данных. Для приведенной выше таблицы были созданы две простые модели (дающие два условных значения): ближайший сосед, который принимает значения для соседа выше, и сосед ниже, и ближайший сосед + 25%, что увеличивает значения ближайшего соседа для учета смещения неполучения ответов.
  2. Оцените недостающую точку данных , используя выбранную модель. Например, модель ближайшего соседа может сгенерировать 9 за отсутствующее значение Y2.9 — это значение одного из ближайших соседей (Y1).
  3. Повторите шаги 1 и 2 (вы можете использовать одну и ту же модель или разные модели) 2–5 раз для каждой отсутствующей точки данных (это дает вам несколько вариантов для отсутствующих данных).
  4. Подстановки для отсутствующих точек данных, рассчитанные по двум моделям (с округлением до ближайшего целого числа).


  5. Проведите анализ данных . Например, вы можете захотеть провести t-тест или ANOVA. Тест должен выполняться для всех отсутствующих наборов точек данных.В этом примере сгенерированы четыре набора ниже, поэтому выбранные вами тесты будут выполняться четыре раза (по одному для каждого набора).

  6. Усредните значения оценок параметров , дисперсий или стандартных ошибок, полученных из каждой модели, чтобы получить одноточечную оценку для этой модели. Другими словами, вы можете объединить результаты из двух наборов данных, сгенерированных из модели 1, а также вы можете объединить результаты из двух наборов данных, сгенерированных из модели 2.

Хотя упрощенный пример выше может показаться интуитивно понятным, вычисления для аппроксимации пропущенных значений удивительно сложны .В них участвуют:

  • Байесовский анализ , который объединяет предварительную информацию об интересующем параметре с новыми данными из выборки.
  • Передискретизация из предсказанных распределений, где большое количество меньших выборок одного и того же размера многократно отбираются с заменой из одной исходной выборки.

Не только вычисляются множественные возможности для пропущенных значений, но и каждое предлагаемое значение может быть получено из разного распределения вероятностей.Этот анализ практически невозможен вручную без хорошего знания байесовской методологии. Шафер (1999) предупреждает, что

«… наивный или беспринципный метод вменения может создать больше проблем, чем решить, искажая оценки, стандартные ошибки и проверки гипотез».

Чтобы избежать этих ловушек, Рубин (1991) рекомендует, чтобы вменение было:

  1. Примените априорное распределение вероятностей к любым неизвестным параметрам с помощью байесовского анализа, моделируя м. независимых отрисовок из условного распределения Y пропущено при условии Y , наблюдаемого по теореме Байеса,
  2. Укажите параметрическую модель для полных данных,
  3. Укажите (если возможно) модель базового механизма, вызывающего недостающие данные.

Использование программного обеспечения

Большинство популярных пакетов статистического программного обеспечения имеют опции для множественного вменения, что требует небольшого понимания фоновой байесовской работы. Например, процедура IBM SPSS MI по сути представляет собой «наведи и щелкни»:

  • Выберите «Анализировать»> «Множественное вменение».
  • Выберите> 2 переменных для модели.
  • Укажите количество вменений. Значение по умолчанию — 5.
  • Укажите набор данных или файл данных для вывода.

Другие популярные варианты программного обеспечения:

  • R: Analytics Vidhya предлагает хороший обзор нескольких пакетов R, которые работают с недостающими данными, включая множественные вменения.
  • SAS : Используйте процедуры PROC MI или PROC MIANALYZE.

Использование программного обеспечения — не идеальное решение. Следует внимательно выбирать подходящие модели для ваших данных. Например, если ваши данные не распределены нормально, вам может потребоваться преобразовать переменные, чтобы они приближались к нормальному распределению, прежде чем запускать процедуру вменения.Другими словами, это не так просто, как ввести данные и выбрать вариант множественного вменения. Неправильный выбор модели, отсутствие модерирующих переменных или исключение важных точек данных могут привести к еще большему смещению, чем вы имели бы без запуска процедуры.

Существует множество опций для заполнения недостающих данных.

Не существует «идеального» метода для заполнения недостающих данных. Как указано выше, множественные вменения могут быть трудными для понимания и реализации без некоторого понимания выбора модели и байесовской теории.Некоторые другие варианты, которые проще и могут быть более эффективными, чем MI, включают:

  • Замените отсутствующие значения средним или медианным значением для набора. Обычно не рекомендуется, если у вас есть всего несколько пропущенных значений.
  • Используйте линейную регрессию, чтобы заполнить пробелы. Линейная регрессия создает простую модель (линию), в которой легко экстраполировать или интерполировать отсутствующие значения. Подходит только для линейных данных, таких как рост, вес или уровень дохода.
  • Заменить отсутствующие значения на значение перед ним . Это может сработать, если кажется, что ваши ценности имеют тенденцию (в отличие от ценностей, которые встречаются повсюду).
  • Игнорировать наблюдения с отсутствующими данными или взвешивать полные наблюдения (т. Е. Уделять больше внимания полным данным и меньшее значение неполным данным). Игнорирование случаев с отсутствующими данными может быть вариантом, если у вас достаточно большой размер выборки. Для небольших выборок каждая точка данных может быть критичной.
  • Заполните пустые поля нулями . В основном вариант, если у вас есть несколько некритических пропущенных точек.
  • Используйте алгоритм k-ближайшего соседа или EM-алгоритм для создания недостающих точек данных. Сопоставление ближайшего соседа логически сопоставляет одну точку данных с другой, наиболее похожей точкой данных. Алгоритм EM работает, выбирая случайные значения для отсутствующих точек данных и используя эти предположения для оценки второго набора данных. Новые значения используются для создания лучшего предположения для первого набора, и процесс продолжается до тех пор, пока алгоритм не сойдется в фиксированной точке.

Дополнительная литература:
При более глубоком изучении ИМ вы действительно не сможете превзойти оригинальную работу Д. Б. Рубина «Множественное вменение для неполучения ответов в опросах» (Нью-Йорк: Джон Вили, 1987). Если вы не можете найти книгу, вы можете прочитать здесь pdf-версию метода МИ Рубина.

Ссылки:
Little RJA & Rubin DB (2002) Статистический анализ с отсутствующими данными (второе издание). Уайли, штат Нью-Джерси.
Рубин , Д.Б. (1977). Вывод и недостающие данные.Биометрика, 63, 581-592.
Рубин , Д.Б. (1978). Множественные вменения в выборочных опросах — феноменологический байесовский подход к неполучению ответов. Труды секции методов исследования опросов Американской статистической ассоциации, 20-34. Также при вменении и редактировании ошибочных или отсутствующих данных обследования, Министерство торговли США, 1-23.
Рубин, Д. (1986). Основные идеи множественного вменения в случае неполучения ответов. Методология исследования, июнь 1986 г. Том 12, №1, стр. 37-47. Получено 24 августа 2017 г. с: http: // www.statcan.gc.ca/pub/12-001-x/1986001/article/14439-eng.pdf
Schafer , J. (1999). Множественное вменение: праймер. Получено 23.08.2017 из: http://hbanaszak.mjr.uw.edu.pl/TempTxt/Schafer_1999_MultipleImputationAPrimer.pdf

. ————————————————— —————————-

Нужна помощь с домашним заданием или контрольным вопросом? С помощью Chegg Study вы можете получить пошаговые ответы на свои вопросы от эксперта в данной области. Ваши первые 30 минут с репетитором Chegg бесплатны!

Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .


Определение вменения по Merriam-Webster

импутация | \ Im-pyə-ˈtā-shən \ а : обвинение отрицал любое обвинение в несправедливости .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *