?

Log in

No account? Create an account

Entries by category: общество

2016-01

В теории, теория и практика - это одно и то же, а на практике...

[English version: https://medium.com/@oleksandr_now/in-theory-theory-and-practice-are-the-same-in-practice-however-46fd663f8e7b ]

Во всем этом модном data science есть большая засада.

Подготовка датасетов звучит совсем не модно и не круто, и про нее мало пишут. Даже люди из индустрии, не говоря уже о академии. Более того, иногда в пейперах проскакивают вещи от которых у меня вообще волосы дыбом подымаются.

Что-то вроде "мы выкинули все что у нас не отпарсилось", а как насчет того, что "не парсится" - это всегда смещенная неслучайная выборка? Которая смещает остальной датасет тоже далеко не случайным образом?

Ладно, как оно смещает саму статистику - это дело хозяйское и на совести авторов, конечно. Но еще это от входа означает что результаты пейпера, а то и алгоритм в принципе, маловероятно что применим в продакшне.

Например, "мы можем парсить 98% слов из аудио правильно" это звучит замечательно, пока ты не узнаешь что в 2% входят например названия улиц или номера телефонов, потому что они не словарные (out of vocabulary)
И на реальной задаче эти 2% слов превращаются в "70% диалогов не получилось отпарсить".

Самих академиков тоже можно понять, им пейпер написать надо, а не пытаться обьять необьятное, конечно. Но вот эта пропасть между теорией и практикой создает очень искаженное впечатление, и последующий шок у людей, которые переходят от теории к применению этой самой теории.

Да и индустрия тоже не спешит это как-то закрывать, потому что из-за того самого искаженного впечатления оно ни разу не является бизнес-нишей, люди не готовы платить за решение этой проблемы, потому что ее вроде бы как и нет вовсе. Пока ты с ней сам не столкнешься.

И вот у меня есть хороший программистский бэкграунд, чтобы с этим справляться, но что советовать людям, у которых опыта меньше - как-то пока непонятно совсем. Есть идеи?

This entry was originally posted at http://wizzard.dreamwidth.org/482707.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

За (корпоративную) культуру.

https://medium.com/@amyvertino/my-name-is-not-amy-i-am-an-uber-survivor-c6d6541e632f#.a49xdz9v7

К сожалению, история гнобления девочки в Uber по ссылке выглядит абсолютно реальной; к счастью, в разных компаниях корпоративные культуры отличаются разительно, вопрос в приоритетах.

Мизогиния сейчас модный хайп, а так-то абсолютно то же самое случается с мальчиками которые не умеют или не хотят играть в статусные игры тоже, только что про это людям еще и писать стыдно.

Контролировать это дело в конторе, в целом, непросто, потому что оно абсолютно ортогонально бизнес-целям, и будучи оставленным в покое -- запросто самостоятельно уплывает в говно.

По моим личным наблюдениям, если контора построена через лидерство, самоорганизацию и низовую инициативу, то такого минимум, а если через статусность и иерархию -- то типично дохера.

Наверняка есть и исключения, конечно. Такое.

А, да. Почему больше всего гнобления достается идеалистичным/инициативным при этом столкновении культур.

Люди, которые аксептят жестко иерархический способ организации - им норм и сидеть внизу пирамиды тоже. Они это принимают, людей выше уважают, то-се.

А вот людей которые не аксептят он страшно батхертит в любой ее точке. Даже на вершинке.

И этот батхерт теми кто живет в иерархии -- интерпретируется как конкуренция за вылезть наверх по пирамидке, ну, потому что им это важно и они так мир видят.
Вот они, соответственно, этого человека и начинают гнобить.

This entry was originally posted at http://wizzard.dreamwidth.org/479660.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

Jacob Appelbaum'a (разработчика Tor) обвиняют-с

http://arstechnica.com/tech-policy/2016/06/tor-developer-jacob-appelbaum-quits-after-sexual-mistreatment-allegations/

что-то мне это напоминает, как Интерпол пытался нейтрализовать Ассанжа похожими методами... надо признать, что общество таки стало гуманнее -- вместо физического убийства человека в чем-нибудь эдаком обвиняют и тянут резину, пока у него репутация не разрушится, а потом говорят "упс, ошибочка вышла".

This entry was originally posted at http://wizzard.dreamwidth.org/473221.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

Про контроль версий

... а точнее, про монолитные репозитории vs много репозиториев

http://gregoryszorc.com/blog/2014/09/09/on-monolithic-repositories/ - вот всё так.

TLDR: Люди уходят, приходят, проекты мержаются, мэпить это на топологию репозиториев - лишняя работа. Ну и операции часто должны (транзакционно) покрывать много репозиториев сразу.

Всё упирается только в контроль доступа к части репозитория (поэтому я сам по факту сейчас использую модель с многими репозами, увы), и в частичное клонирование. Это решаемо.

В итоге Google сидит на Perforce, а Facebook активно допиливает Mercurial, по мере того, как находят в нём новые ограничения :)

Ну и Git, кстати, начал шустро подтягиваться, когда фанаты увидели, что Hg стараниями фейсбука начал выходить из статуса маргинальной DVCS :)

This entry was originally posted at http://wizzard.dreamwidth.org/428016.html. It has comment count unavailable comments. Please comment there using OpenID.

photo25

Про маркетинг решений для гиков

Гики, которые считают, что маркетинг - это балщит, и они на него не ведутся - неправы.

Просто они ведутся на сайты а-ля https://otr.cypherpunks.ca/ а не https://silentcircle.com/ , т.к. привыкли, что "софт без неприятных неожиданностей" (а именно это во многом создаёт то самое психологическое ощущение безопасности - после того, как закончился период первоначальной адаптации) выглядит так.

Ну и каждое новое поколение/субкультура имеет свой особенный культурный контекст в этом смысле. Чуть ли не вплоть до того, какую фантастику читали в детстве. Потому что дизайнеры намеренно или бессознательно проецируют свою этическую систему и мораль "что можно, что нельзя" на дизайн продукта (как код, так и оформление), после чего естественным образом там остаются те, кому это близко по душе.

Ну и из разных контекстов потом произрастают фанаты PGP, фанаты Telegram, OTR, CryptoCat и так далее.

А, да. Справедливо не только для секьюрных мессенжеров, а и для "средств общения вообще". Чего стоит одно недолюбливание мобильных телефонов в США стараниями Голливуда.

(Выводы сделаны после продолжительного догфудинга разных секьюрных мессенжеров и попыток анализа их совокупного влияния на привычки и прочий OPSEC своих пользователей, а сам пост - развернутый комментарий на пост arkanoid)

КДПВ, somehow related:


This entry was originally posted at http://wizzard.dreamwidth.org/414193.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

Частные государства

В июне американец Иеремия Хитон отыскал на карте кусочек африканской пустыни, который официально не принадлежит ни одному государству. Апеллируя к законам колониальной эпохи, он назвал его своим и требует признания у соседей. В будущем он планирует построить там процветающую монархию, а деньги собирается искать через краудфандинг. Apparat взял у Хитона интервью.


http://apparat.cc/world/king-of-the-north/

См. также:

https://ru.wikipedia.org/wiki/Провинция_Хатт-Ривер
https://ru.wikipedia.org/wiki/Силенд

This entry was originally posted at http://wizzard.dreamwidth.org/386574.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

Комьюнити, хаброта, фискальный next-gen, и местами аж до киберсина. Тезисно.

TLDR: Почему хабр скатился в говно? В какое говно скатится стэковерфлов? Может ли скатиться в говно электронное правительство? Скандалы, интриги, расследования :)

0. Любые правила (введенные технически или административно) приводят к определенному отсеву и формировании культуры сообщества.

Это гораздо больше заметно на онлайн-сообществах, нежели в офлайне, потому что проходит за годы, а не за поколения.

1. Не-модерируемые системы (E-mail)
В организации отражают соцструктуру организации. В диком интернете - скатываются в спам.

1б. E-mail с антиспамом
В целом, то же самое.

2. Модерируемые мейллисты
Зависит от модератора (да, я кэп). Не масштабируются по очевидным причинам.
Скайпочаты и краткосрочные Фейсбук-группы имеют сходную динамику

2. FIDO и прочее
Не участвовал, не могу прокомментировать.

3. Форумы с кармой, "спасибо" и медальками*
Конечно, неправильно их все под одну гребенку, но в целом интересная среда, требующая, тем не менее, активного участия команды модераторов. Один модератор заебывается.
Если есть только карма - система склонна вырождаться. Медальки намного лучше - хоть и грубо, но отражают то, что у людей более одного "свойства".

Поскольку карму могут крутить не только модераторы, назовем это метамодерацией первого поколения.
Масштабируются довольно далеко. Вырождается, если модераторы заебываются постоянным притоком новых юзеров (Eternal September), хорошо держится, если комьюнити тематическое.

Спам обычно загоняется в тематические разделы ("купля/продажа")

4. Метамодерация второго поколения
Ключевое отличие - карма дает привилегии автоматически, а также усиливает действия (вес голоса и т.д.)
Очень хорошо выдерживают взрывной рост комьюнити. После чего вырождаются в культ "желтой прессы" (написать что-то, что хочется импульсивно оценить - Slashdot, Хабр) и взаимного облизывания (eBay)
Умеют отсеивать примитивный спам, уязвимы к спаму, маскированному вбросами.

Масштабирование, как и с форумами, улучшается тематической фрагментацией (Reddit)

5. Метамодерация третьего поколения
Ключевое отличие - действия, которые могут быть оценены, имеют более-менее обьективную структуру.
Также обычно правила написаны не с бухты-барахты, а довольно-таки точно.
Также обычно есть мета-форум с открытым обсуждением этих правил. Тоже имеются медальки.

Пример - StackOverflow. Очень хорошо масштабируется, открытый комьюнити-процесс помогает селекции более адекватных модераторов, чем в Wiki и Habrahabr, но тоже имеет свои пределы.

Практически имунны к спаму, обьективная структура действий гасит эмоциональную компоненту обсуждений. Ключевая проблема - непригодны для обсуждения теоретико-философских вещей, а также нахождения *новых* решений наболевших вопросов (известное решение заплюсуют, новое не поймут)

6. Неявная модерация

Сообщения (не группы) Facebook, VK, Twitter, whatever.
Черный ящик эвристик которые направлены, в основном, на подавление фишинга, вирусов и спама.
Уязвимо к скатыванию в цензурирование.

7. Я тут еще дофига всего опустил. В частности, нету Wikipedia, Wikia, Ning, LiveJournal, Diary.ru, ClosedCircles, стандалонов, Google+, Steam Trading Cards, внутричатов MMO (они еще и разные бывают). Дополнения всячески приветствуются.

8. При чем тут фискальный nextgen и киберсин?
Я утверждаю, что очень скоро вся эта карма и плюшки начнут применяться для автоматического принятия решений, вначале посредством экспертов "чего б нам такое замутить", а потом и полностью автоматически. Примерно с такими же последствиями, как сейчас применяется налоговое законодательство.

В этот прекрасный новый мир хорошо бы вьехать подготовленными. Поэтому - discuss!

--

* медальки, которые не являются символами статуса "этот персонаж крутой", а которые демонстрируют "историю" персонажа, из которой надо *самостоятельно* делать выводы.

This entry was originally posted at http://wizzard.dreamwidth.org/323879.html. It has comment count unavailable comments. Please comment there using OpenID.

2016-01

да что ж за засада такая-то

почти все письма от ми попадают в спам, стоит только попытаться написать людям “я хочу у вас купить то-то”.

при этом домен и айпи ни в одном блеклисте не состоит, вирусни там тоже не водится. но с гмыла письма доходят заметно чаще (не всегда тоже). вайтлист?

засада какая-то, вообщем :/ как с этим бороться? а то телефоны не все пишут, да и не всегда удобно звонить (ночью например…)


2016-01

...а интернет все не кончается

в этом мире *настолько* много людей, что можно на ровном месте сформировать (достаточного обьема, чтобы не оставалось места чему-либо еще) поток новостей и срез мировоззрения, состоящий буквально из чего угодно.

еще и не сходя с места.

да, конечно, Real Life, уникальная игра с лучшей в мире графикой (только до тех пор, пока не найдут способ трансляции картинки в мозг, а еще, говорят, отдельные вещества картинку улучшают, но я не пробовал), но большинство людей, окружающих меня, не могут отличить пересказанного от настоящего…

мы склонны доверять друзьям, склонны преувеличивать страхи, бояться реальности, бояться неизвестности и ошибок. на практике это означает, что большинство из нас живет в выдуманном мире.

это не то чтобы очень плохо, это просто аргумент в пользу того, что его вполне реально изменять, в отличие от мира реального. просто настройкой фильтров.

да, а к чему я это все? не знаю. просто так. чтение интернета брожением по ссылкам дает картину, совершенно отличающуюся от чтения интернета через интерфейс поисковика. особенно злачные в этом отношении социальные графы и графы научных статей (простите, чем богаты, тем и рады. наверное, есть и другие примеры)

а, ну и большинство моих последних знакомств были так или иначе посредством Сети. что является хорошим примером того, как можно распространять изменение виртуального мира на мир реальный, т.к. новые люди всегда означают новые места, занятия и события.

the world is changing. окружающая среда дает очень много возможностей. которые проходят мимо. подумайте об этом. если у вас есть время думать… (у меня его тоже обычно нету. но вот одну ночь удалось урвать.. вот и результат..)