§ Зачем нужно
В искусственных нейронных сетях очень удобно использовать логистическую функцию (сигмоиду):Почему так? Это все из-за того факта, что при дифференцировании получается та же самая начальная функция и не требуется дополнительно что-то вычислять, что сокращает процессорное время.
§ Вывод дифференцирования
Как можно заметить, - сложная функция и потому ее надо дифференцировать по цепному правилу:То есть, в качестве аргумента функции сначала выступает и берем ее производную, а потом умножаем на производную этого аргумента и так далее.
То есть, где и потому . Между прочим, у аргумента экспоненты тоже берем производную, и получается как раз тот самый минус перед ней.
Соберем все вместе:
Выглядит страшно. Но это еще не все. Сделаем такой очень хитрый трюк, в числитель добавим и тут же вычтем единицу:
А теперь разделим вычитание:
После того как сократили первое слагаемое, останется вот что: