До чего дошел прогресс, думают роботы, а не человек!

Вчера решил возобновить практику записи видеоблогов для YouTube. Мне кажется, я подобрал интересный формат. Это будет не “я многое понял” и не записи видео моего Obsidian (хотя когда-нибудь сделаю), а видеоэссе.

Передо мной стоял выбор: создать почтовую рассылку со своими публикациями (сейчас коллекция значительная, совокупно около 20 тысяч слов, еще немного, и пора отдельную книгу издавать) или что-то другое.

Я выбрал что-то другое, а именно подумал, что YouTube будет доступнее. Единственное, размышляю сейчас, имеет ли смысл публиковать на VK или нет. Мне не очень нравится аудитория этого сервиса (какая-то токсичная). Вместо VK, мне кажется, правильнее публиковать в Telegram.

Я люблю работать с текстом значительно больше, чем с видео, но с видеоблогом я убиваю тут двух зайцев: сначала пишу эссе и накапливаю идеи, а потом снимаю отдельными арками: заметковедение, заметконаблюдение, о творчестве, система задачиделания, клиповое мышление, второй мозг (extended mind).

Ну вот, записал я вчера видео, к нему еще нужно придумать теги, название, вставить описание и всякую прочую чепушню. Название должно быть кликбейтным, а как иначе? И вот что я придумал: а что если мне брать транскрипцию моего текста, загружать в GPT и просить его все это сделать? Остается вопрос, как транскрибировать?

Whisper

Однако у меня нет IT-компетенций, то есть я не смогу самостоятельно настроить. Что дальше? Правильно, снова GPT. Я открываю приложение GPT, “показываю” ему терминал и говорю: давай настраивать.

Блин… как же жить становится просто. Настройка Whisper оказалась идентичной эксперименту про китайскую комнату. Очень круто и очень удобно, я теперь перестал “бояться” всяких технических аспектов настройки, где требуется знание и взаимодействие с сервисом или программами через командную строку.

Открываю GPT, ставлю задачу и вперед. Действительно человек вместе с машиной может значительно больше, чем каждый по отдельности.

Люди, накидайте, пжл, (в панамку умных мыслей, а не резиновых изделий), на такую идею:
Купить комп с видеокартой и развернуть в контейнерах локальную версию Whisper и DeepSeek и использовать через VPN

p/s Рустам, вчера у тебя прочитал про локальный Whisper и подумал, а может… ))

Все зависит от чувствительности данных.

Если данные нежелательно показывать мира, например коммерческая или научная тайна (такое часто можно встретить), то однозначно разворачивать.

Я об этом думал сам. Виспер отлично работает и на локальной машине, там много мощи не надо. А вот если дипсик и всякие геммы на большое количество параметров, то нужно.

У меня гемма 12b сильно подвешивает систему. Я вместо этого купил для своего обсидиан copilot plus, офигенски работает и пользуюсь платной версией GPT. По большому счету мне GPT хватило бы, но я решил, буквально, “поверить” в Логана и копилот ) Крутое приблуду для обсидиан делают

Попробую подключить copilot и поиспользовать. Ещё поизучаю может ли copilot транскрибировать, в частности видео с rutube, некоторые приближаются к 2 часам.

Rutube не пользуюсь, потому что там найти что-то тот еще квест. А для YouTube отлично работает https://youscriptor.com. Продолжительные видео неплохо транскрибирует, с возможностью выгрузки в .md и .pdf.

А цель какая? Сформировать текст или выучить вопрос? Если выучить, выяснить, разобраться - то восприятие информации на слух с последующей печатью в файл (конспектирование) сильно лучше автоматического транскрибирования. )))

1 лайк

Расскажу про свою…

Я вернулся к записи видосиков для ютуб канальчика, стараюсь сейчас записывать короткие 10-12 минут видео, тренирую себя. И вот какая интересная штука, оказывается я очень не люблю работать с видео, в том плане, что нужно придумывать названия, теги и прочее. Не говоря о графике для баннера и прочим оформлением.

Так что я удумал, беру видосик прогоняю через виспер, прошу транскрипцию, потом использую в GPT чтобы создать кликбейт тайтл, ключевые слова и идею дизайна плашки – баннера.

Пока сделал пару, получилось ничо … сегодня попробую очередное видео подобный образом записать

А написанного заранее текста для видео разве нет? Чистая импровизация?

Есть конечно, но он на заметках в смысле в видео аутлайнера и по ходе рассказа я обычно добавляю всякого )

Тут либо исходный текст сохраняет актуальность — либо это чистая импровизация. В первом варианте транскрипция не нужна. Но втрой наверное намного зажигательнее. )))

Да, зажигательней, но я все равно использую некоторые опоры ))

Уже посмотрел достаточно много видео и чтобы повторно не смотреть рассматриваю вариант сделать траскрибацию этих видео и скимингом обработать полученные тексты - выделить только, то что мне интересно.

1 лайк

Copilot для Obsidian, который бесплатный, без плюса, не работает ни с видео, ни с аудио, ни с вложениями в виде файлов или картинок. К запросу можно добавлять только ссылки на заметки, и их текстовая часть загрузится в контекст диалога с нейросетью. Либо, если хранилище проиндексировано, загружаются в контекст кусочки близких по смыслу заметок, но тоже текстовые.