Data Coffee-logo

Data Coffee

Technology Podcasts

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)

Location:

Russia

Description:

Подкаст о данных в современном мире. Мнения экспертов и опыт в получении, хранении, обработке, визуализации и принятии решений на основе данных. License: CC BY-NC-ND 3.0 (https://creativecommons.org/licenses/by-nc-nd/3.0/)

Language:

Russian


Episodes

95 (S3E28). Как дата инженерам и аналитикам дружить?

5/30/2023
Тема выпуска Как дата инженерам и аналитикам дружить? В гостях у подкаста `Data Coffee` Игорь Мосягин — Data Engineer в шведской финтех компании Klarna (Twitter, Youtube, LinkedIn) Shownotes: 0:49 Классический вопрос 3:06 Inverse podcast 7:13 Уровни data security 10:38 Технический стек 14:28 Взаимодействие с аналитиками 16:50 On-boarding 20:50 Аналитики и контроль 25:09 Про Redshift 27:11 Документация и её метрики 30:05 Философия про документацию 31:19 Выстраивание процесса on-boarding 34:45 Самомотивация и quantified self 39:35 Про PhD 50:03 Data catalogue 58:04 Мотивация преподавать 1:06:37 Вдохновение Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:10:00

94 (S3E27). Уязвимость в Telegram, терминал для MacOS и CozoDB

5/20/2023
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями! Shownotes: 2:56 A FOSS embeddable, transactional, relational-gr... 7:36 Уязвимость в Telegram для MacOS 13:07 Cyte.io A visual, searchable knowledge base of... 21:18 Typst - better then latex? 33:06 Европейский AI Act, если его примут, потребует.. 33:39 Милый эмулятор древнего мака 38:39 Маководам попробовать какой-то модный тер... 53:38 Another terminal session recorder Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:00:53

93 (S3E26). Elon Musk, -10x engineer, Airflow, dbt, OMD

5/13/2023
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями! Shownotes: 5:30 Глобус, показывающий расположение спутников 6:38 Airflow 2.6 13:36 How to be minus 10x engineer 21:24 30 лет назад началась эра WWW 24:54 Arc from The Browser Company 32:48 OpenMetaData 1.0 39:49 Книга, написанная в соавторстве с нейросетью GPT-4 42:13 LLM as a backend 51:48 Уровень лития в грунтовых водах и здоровье 56:31 Кишечную микробиоту назвали фактором развития нервной анорексии 58:35 dbt 1.5 1:04:37 Java in AWS Lambda Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:06:10

92 (S3E25). Зачем писать свой Data Catalog

5/6/2023
Тема выпуска Зачем писать свой Data Catalog В гостях у подкаста `Data Coffee` Иван Канашов — Data Engineer в компании Тинькофф (GitHub, Telegram) Shownotes: 0:47 Coffee 3:15 Зачем писать свой датакаталог 6:58 Модель данных каталога 9:08 Обновление данных в каталоге 17:40 Как говорить с бизнесом 21:03 Как решили идти в open source 23:37 Почему метаданные описывают не владельцы 25:20 Как понять, что каталог успешен 27:49 Lineage 29:59 Сколько времени ушло 31:49 Ролевая модель 35:13 Используется ли ML 37:23 Где посмотреть UI 40:18 Выйти и вернуться в IT 45:18 Каждый получает кайф там, где хочет 49:47 People & Data Governance 54:15 Будущее Data Governance систем 55:45 Что почитать и что поучить Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:59:27

91 (S3E24). Немного про данные и нет кофе (обычный)

4/29/2023
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями! Shownotes: 3:58 Pycharm 2023.1 12:10 Snowflake plugin for vscode 22:04 Почему люди тупят после covid-19... 28:00 Pandas 2.0.0 35:59 Веселая кринжота 37:58 Сам нашел: две имплементации gpss 41:48 Илон маск зарегистрировал компанию в сфере иску... 42:19 Miller — утилита для работы с текстовыми данны... 52:23 Reddit сделает доступ к своему api платным — из... 54:19 Chatgpt, химия, индекс хирша и рафаэль луке 58:44 K8gpt to debug k8s 1:07:41 Chatgdb 1:11:06 Вспомнить все Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:13:04

90 (S3E23). Terrific Microsoft Excel

4/22/2023
Тема выпуска Terrific Microsoft Excel В гостях у подкаста `Data Coffee` Генрих Ананьев — руководитель направления автоматизации отчётности и моделирования в Beluga Group (Habr, Email) Shownotes: 1:15 Голосование за кофе 3:53 Какое отношение гость имеет к теме 7:35 Alex попытался пройти обучение 9:30 Почему Excel настолько популярен 11:04 Погружаемся в историю 24:40 Почему пользовательская часть популярнее 30:52 Альтернативные табличные процессоры 34:13 Преимущества перед конкурентами 55:30 Анализ данных 1:05:50 Вот Excel, сделайте теперь нормально 1:09:00 PowerPivot и другие надстройки 1:14:52 Можно ли повлиять на roadmap 1:17:45 Lambda-функции в Excel 1:21:25 Популярные проблемы 1:27:58 Игры на Excel Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:30:24

89 (S3E22). Postman Flows, классический Twitter и галлюциногены на Майорке

4/15/2023
Ведущие подкаста 'Data Coffee' обсуждают новости и делятся своими мыслями! Shownotes: 0:22 Внезапный LaTeX 2:21 Как всегда про Twitter 5:43 Разборки с TikTok 12:18 Тусовки на Майорке 16:51 Изящное кладбище сервисов Google 22:27 Экзопланета с магнитным полем 25:52 Postman Flows 29:11 Собеседование тех кто возвращается на предыдущее место работы 47:53 Docker Container File Explorer 48:38 Традиционно про Doom Доп.ссылки к эпизоду: - https://github.com/wagoodman/dive - https://www.nuclino.com/ - https://slatestarcodex.com/2016/10/11/somewhat-against-psychiatric-conditions-as-domestication-failure/ - https://gwern.net/google-shutdown - https://www.bradshawfoundation.com/ancient_symbols_in_rock_art/visual_hallucinations_a_cerebral_source.php Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:50:54

88 (S3E21). AWS DataZone, YTsaurus, Postman Flows

4/8/2023
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:00 Introduction 1:05 cURL 8 версия 2:52 Куда же деться от gpt4 4:12 gpt4all на M1 6:17 Прохождение капчи человеком, но есть нюанс 7:47 Новый midjourney с пальцами 11:56 Шедеврум от Яндекса 12:47 Луддиты против LLM 18:03 aicyclopedia 20:15 (не)новый OCR от Microsoft 21:35 Microsoft Loop 23:33 dbt адаптер для Excel 27:56 Terraform в AWS 30:13 AWS DataZone 31:28 MAD landscape 38:24 140МП изображение Солнца 39:22 Новый способ получения потомства у мышей 42:07 Клавиатура Flux 45:18 YTsaurus 47:12 Частичный open source у Twitter 49:16 Virtual tutor for SQL 51:52 Детекция алкоголя в крови по голосу Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:56:47

P1-3. Кофе с психологом

4/4/2023
Shownotes: 0:02 Переезд 4:17 Уехать для и от 8:27 Маленькие неудобства 12:03 Сопричастность и общение 14:18 Любопытство и внутренний ребенок 19:35 Медовый месяц и стресс 25:26 Как понять, что в стрессе 32:49 Ощущение дома 39:57 Приключения 42:34 Переезд с ребенком 49:15 Закрытость, идентичность 1:01:53 Рекомендации при переезде 1:04:51 Закгругляем Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:11:17

87 (S3E20). ChatGPT на помощь учебе и работе

4/1/2023
Тема выпуска ChatGPT на помощь учебе и работе В гостях у подкаста `Data Coffee` Александр Жадан — brand manager CM Games, интересующийся нейросетями (Twitter, Instagram) Shownotes: 1:41 Кофе 2:30 Выбор темы дипломной работы 5:26 Как двигался процесс подготовки текста 10:01 "ChatGPT написал диплом"? 11:53 Сколько времени ушло на запросы 15:13 Отличие результатов для разных языков 17:09 Кто знал об использовании ChatGPT 18:53 Стилизация текста 20:10 Догадался ли кто-то на защите 22:18 Выход за пределы Twitter 26:33 Злобные академики 41:39 Помогает ли ChatGPT бренд-менеджеру 45:20 Письмо остановить разработку 50:07 Решение в итоге принимать человеку 56:28 Инфляция в искусстве Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:01:11

86 (S3E19). Shopping data, рекомендации, облака

3/25/2023
Тема выпуска Shopping data, рекомендации, облака В гостях у подкаста `Data Coffee` Саша Айваз — Chief Data & Analytics Officer, Lamoda Tech (email, Telegram, site) Shownotes: 0:00 Традиционный вопрос 1:50 Lamoda 11:00 Как формируется предложение и какие данные используются 16:30 Data driven decision 18:15 Какие данные собираются 21:18 Только онлайн шоппинг? 21:53 Где хранятся собранные данные 27:04 Про PowerBI 29:42 Данные по люксовой одежде и ML 41:16 Рекомендации 43:39 Качество данных 48:48 Граница облаков и observability 1:00:47 Как стать CDO Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:12:46

85 (S3E18). ЭЭГ, коагулятор, осьминоги, Silicon Valley Bank

3/18/2023
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:43 M1 GPU driver for Linux by Asahi 4:56 Stable Diffusion рисует по MRI 7:45 Сайт Twitter прилег 9:05 Эффективный менеджер Elon Musk 12:27 Вычислитель на основе грибов 20:57 ЭЭГ живого осьминога 22:35 Microsoft Outlook for Mac for free 27:11 Silicon Valley Bank 38:56 GPT-4 42:05 Биопринтер с коагулятором 45:41 AWS client to mount S3 as FS 48:54 A Milliwatt of Doom Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:55:06

84 (S3E17). Беспилотники и картография

3/11/2023
Тема выпуска Беспилотники и картография В гостях у подкаста `Data Coffee` Александр Корвяков — менеджер продуктов в "дорожной области". Shownotes: 1:26 Кофе 4:52 Профессиональный путь 11:58 Какие разные карты 14:16 Сбор данных и принятие решений 17:49 Белый сигнал светофора 22:37 Краудсорсинг карт 28:00 Как хранятся данные 32:34 Определение дорожных знаков 36:14 Где беспилотники 38:04 Зачем беспилотники 39:52 Беспилотники это сплошной if/else 41:29 Как часто надо обновлять карты 42:52 Важность каждого сантиметра 44:38 Автопилот и безопасность 51:34 Сертификация беспилотных автомобилей 58:02 Оценка качества карт 1:00:43 Карьерные советы Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:08:40

P1-2. Кофе с психологом

3/5/2023
Shownotes: 2:06 Гость, Анастасия 3:56 Синдром самозванца 18:12 Как происходит обесценивание 22:34 Зависть и обман 34:21 Грандиозность 43:33 Внешняя оценка 47:51 Немного о великих 50:39 Лечим только бездарностей 55:08 Грандиозность и плохие стихи 1:00:21 Внезапный Гарри Поттер 1:02:09 Немного про трудоголизм Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:18:55

83 (S3E16). YouTube, Bing, EU data salaries и молитвы

3/4/2023
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:34 Apache Superset Export to Excel 2:40 YouTube как файловое хранилище 5:02 Ретроспектива 16:35 DOOM на детальке LEGO с микроэкраном 18:24 Microsoft Bing + GPT 25:25 Linux 6.2: Apple M1 support 30:40 История от Mak'а 35:26 Синяя галочка от Meta за $12 39:29 Europe data salary benchmark 2023 46:58 Lance 48:28 Мозговой имплант для парализованных 52:21 Четвертая мозговая оболочка 55:31 Ещё один способ не работать 56:38 Aurora, meditation train Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:58:00

82 (S3E15). DuckDB, Docker, AWS, Hashicorp, etc.

2/25/2023
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:37 Транскрибация онлайн бесплатно без СМС 2:26 Фреймворк для распознавания голоса 7:52 Бесконечный AI-сериал 10:20 DuckDB 0.7.0 18:32 Azure Managed Apache Airflow 24:36 SQLite WASM 28:50 Netflix аккаунты 32:04 Porting Advisor for Graviton 35:25 Tiny11 - винда 11 на минималках 37:37 Win95-like file manager for win 3.1 41:50 Doom Multi-Monitor 45:48 Microsoft Bing + OpenAI 54:43 HashiCorp Hermes 57:30 Docker for Win 3.x 58:51 MLOps Tools Обложка - OpenAI Dall-E Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:04:02

81 (S3E14). Данные на стройке

2/18/2023
Тема выпуска Данные на стройке В гостях у подкаста `Data Coffee` Виктория Пролетарская — к.т.н. в области работы с данными, 10+ лет в аналитике от e-commerce и travel до банкинга и девелопмента. Shownotes: 0:41 Кофе 1:20 Область работы с данными 6:07 Девелоперская компания 12:40 Что, кроме железобетона 13:57 Логистика 17:26 Масштабирование производства 21:20 Строительство и производство 23:52 Творчество или регламенты 34:39 Исправление результатов 41:18 Примеры аналитических задач 44:45 Биг дата или нет 51:13 ML-инженеры почти не нужны 54:19 Если что-то пошло не так 58:50 Эксплуатация и Петрович 1:03:17 Дашборды на заводе 1:07:39 Инженер данных в строительстве Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:13:47

80 (S3E13). Наукометрия

2/11/2023
Тема выпуска Наукометрия В гостях у подкаста `Data Coffee` Александр Мартиросян — Профессиональный наукометрист. Shownotes: 0:45 Традиционный вопрос 1:38 Что такое наукометрия 3:23 Можно ли сравнивать по странам 4:22 Что мы измеряем 5:33 Значимость конференций и как померить 6:52 Какие объекты мы можем сравнивать 8:04 Как понять, чьи статьи стоит читать 9:44 Кто стоит за WoS и Scopus 12:29 Что такое impact factor 14:17 Зачем нужны цитирования 17:02 Призрак уробороса 18:18 Аналогия с социальной сетью 19:34 Хаки показателей 20:14 Молчаливо смотрим на огромный Хирш 23:29 Зависть к фабрике статей 24:32 Можно ли доверять индексу Хирша 25:20 Какой индекс Хирша у самого Хирша 25:48 Соревновательная хиршеметрия 26:18 Когда ученый становится таковым 28:14 Накрутка и борьба с ней 29:25 ОПГ Хирш 30:49 Манчкинство показателей 32:25 Денежная мотивация и соблазн 34:36 Ученые-диссиденты и альтернативные показатели 36:27 Создание новых метрик 36:55 Где взять наукометрические данные 40:51 Журналы и квартили 43:35 Data Coffee Conference 46:01 Где образуется научное знание 53:00 Как начать заниматься наукой Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:00:00

79 (S3E12). Новости про утечки Yandex, ChatGPT, и другое

2/4/2023
Ведущие подкаста "Data Coffee" обсуждают новости и делятся своими мыслями! Shownotes: 0:00 Alex устал 0:39 Yandex утек в сеть 16:18 ChatGPT и его использование 21:35 Диплом, написанный ChatGPT 33:14 Темы дипломов ведущих 43:47 Больше никаких master/slave 47:25 Tome для презентаций 49:03 Увольнения продолжаются 49:47 Ubuntu для M1 50:54 Rosetta for Docker Linux 55:20 Набор консольных утилит 1:02:20 Hyper Обложка - Midjourney Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:01:10:25

78 (S3E11). Путь в data engineering

1/28/2023
Тема выпуска Путь в data engineering В гостях у подкаста `Data Coffee` Илья Синёв — Senior Consultant Data Engineering at adesso SE (email, LinkedIn). Shownotes: 0:00 Внезапно про MacOS9 2:46 Гость выпуска 4:04 Отношения с кофе 7:11 Профессиональная предыстория 12:19 История развивается 13:25 Третий путь 18:50 Немного про low-code 21:38 И немного про data science 22:06 Про Adesso 23:38 Гребем на маленькой галере 25:48 Реалии второй работы в Германии 27:39 И немного databricks 33:12 low-no-code решения 38:30 Текущая ситуация и планы на будущее 39:39 Azure и AWS 42:21 Что бы сделал иначе 44:01 Перспективы и наука 47:30 И в продакшен, наукометрия 52:54 Помогает ли научный опыт 54:39 Физики и data science Обложка - Midjourney Сайт: https://datacoffee.link, канал в Telegram: https://t.me/datacoffee, профиль в Twitter: https://twitter.com/_DataCoffee_ Чат подкаста, где можно предложить темы для будущих выпусков, а также обсудить эпизоды: https://t.me/datacoffee_chat

Duration:00:59:35