Архив за Март 2013

За гиперссылки на экстремистские материалы блоггеров будут штрафовать

Среда, 20 Март 2013

Правительство РФ может в скором времени принять закон об административной ответственности за размещение в Интернете гиперссылок, ведущих на публикации, признанные экстремистскими. Таковыми могут считаться не только издания, список которых опубликован на официальном портале Минюстиции, но и любые другие материалы по решению суда. Для примера: недавно список экстремистских произведений пополнила песня скандального рок-коллектива Психея «Убей мента». В настоящее время в «черном списке» находится более 1200 позиций и он постоянно пополняется.

За размещение гиперссылок на экстремистские материалы владельца сайта могут оштрафовать на сумму от тысячи до трех тысяч рублей. За размещение гиперссылок на запретные материалы на порталах официальных СМИ штраф будет гораздо больше – от пятидесяти до ста тысяч рублей. Также Министерство связи планирует ввести в виде меры наказания за данное нарушение закрытие веб-ресурсов сроком до трех месяцев, с удалением всех публикаций.

Правда, пока что это предложение существует только в виде законопроекта. Его авторы предлагают приравнять размещение гиперссылок на материалы, признанные экстремистскими, к самому факту распространения таких материалов. В соответствии с законопроектом, Интернет-издания, публикующие на своих страницах запретные гиперссылки будут отвечать перед законом по статье 20.29 КоАП РФ. Поскольку список запрещенных материалов растет не по дням а по часам, многие Интернет-пользователи могут нарушать закон, сами об этом не подозревая. В первую очередь в список потенциальных раздатчиков экстремистских гиперссылок попадают активные блоггеры и пользователи социальных сетей. Новость о законопроекте уже вызвала бурные обсуждения в их рядах.

Спонсоры WebMilk: Film2 — блог о кино, Catalogr — весь русский Web 2.0. |
Permalink |
Комментарии: 4

Microsoft теряет деньги на поисковике Bing

Среда, 20 Март 2013

Компания Microsoft, по заявлению руководства, продолжает «испытывать энтузиазм» по поводу перспектив своего поискового сервиса Bing. Правда, энтузиазм сопряжен со значительными денежными затратами. Например, только за последний финансовый квартал корпорация вложила более 713 миллионов долларов в развитие Bing. За предпоследний квартал было потрачено $411 миллионов.

Похоже на то, что такие вложения оправдывают себя – к примеру, за тот же последний квартал прибыль от размещения рекламы на Bing выросла на 19%.

Сейчас ситуация на поисковом рынке выглядит следующим образом: Google принадлежит 85,75 мирового рынка Интернет-поиска, Yahoo – 5,38%, Baidu – 3,52%, Bing – 3,11%.

В стремлении привлечь новых пользователей, разработчики Bing стараются создать как можно более функциональный дизайн, который действительно будет удобен для посетителей. Джефф Хеншау, менеджер по продуктам Microsoft, утверждает, что нынешний дизайн действительно очень хорош – и с точки зрения функциональности, и с точки зрения графического оформления. «Каждый день Bing все более и более эффективно выполняет задачи, и мы стараемся дополнять функционал сервиса», – говорит Хеншау.

Главный вопрос сейчас – сколько еще Microsoft будет мириться с убыточным онлайн-подразделением в своей компании. Анонимные источники утверждают, что некоторые крупные инвесторы корпорации уже не желают более терпеть убытки.

Отметим, что сделка с Yahoo! еще далека от того, чтобы приносить прибыль – предстоит еще много этапов работы по этому проекту, прежде, чем общая схема сотрудничества станет полностью функциональной. Скорее всего, сделка начнет «работать» ближе к 2014 году – по крайней мере, так считает руководство Microsoft.

Спонсоры WebMilk: Film2 — блог о кино, Catalogr — весь русский Web 2.0. |
Permalink |
Комментарии: 1

Общее руководство по оценке качества поиска от Google. Версия 1.0

Суббота, 9 Март 2013

В начале марта 2013 года Google официально опубликовал версию 1.0 руководства для асессоров по оценке качества поиска. Документ насчитывает 43 страницы и является официальной сокращенной версией руководства, утвержденного в ноябре 2012 года. Любопытно, что ранее в интернет уже просачивалась версия 3.27 General Guidelines. Она была датирована 22 июня 2012 г. и содержала 161 страницу.

«Общее руководство по оценке качества поиска», прежде всего, предназначено для асессоров Google, работающих по всему миру, и оценивающих качество веб-страниц и поиска в целом. В документе приводится подробное изложение основных принципов, которыми должны руководствоваться асессоры Google в ходе своей работы. Руководство включает в себя инструкции по оценке качества поиска, кроме того, в нем рассматриваются подробные примеры оценки страниц, перечислены наиболее распространенные случаи сложностей, возникающих у асессоров при оценке сайта.

Основное, что следует усвоить веб-мастерам из приведенного документа: асессоры оценивают не домен в целом, а каждую страницу сайта в отдельности, присваивая ей определенный рейтинг. Далее, исходя из общего рейтинга страниц, сайту присваивается их усреденный рейтинг. Кроме того, в настоящее время все поисковые запросы Google делит на: навигационные — если пользователь осуществляет поиск конкретной веб-страницы по ссылке; информационные — когда ищут информацию по определенной теме; и деловые — когда пользователь ищет конкретный продукт или услугу.

Также представители Google напоминают, что весь основной контент интернет-гигант делит на следующие категории:

1. Основной контент: новостные статьи, записи в блогах, информация о продуктах и услугах, видео, поисковые блоки или области для ввода логина и пароля при входе на сайт.

2. Дополнительный контент: элементы внутренней навигации, ссылки на похожие продукты или ссылки на видео.

3. Рекламный контент: рекламные объявления, ссылки на спонсоров, списки спонсоров и т.п.

При этом, участники команды Google заявляют, что ни один из перечисленных типов контента не является доминирующим для поисковой системы. Это значит, что ни одному из типов контента автоматически не присваивается ни высокое, ни низкое качество. Также рейтинговая оценка не может быть выставлена только исходя из соответствия запросу. Асессоры обязаны выставлять оценки исключительно, исходя из качества контента опубликованного на странице.

Теперь рассмотрим документ Google подробнее:

Первая глава первой части Руководства посвящена оценке страниц сайтов в целом. В ней приводится руководство по работе с интерфейсом для асессоров, руководство по оценке URL, информация о безопасности в интернете, напоминания о том, каким критериям должны соответствовать асессоры Google.

Во второй главе даются более подробные инструкции по изучению и рассмотрению поисковых запросов и оценке контента на предмет соответствия запросам пользователей. Приводится классификация запросов, рассматриваются проблемы многозначных, информационных, локальных, навигационных и других наиболее «проблемных» поисковых запросов.

[ >>>> ]

Третья глава «Общего руководства по оценке качества поиска» посвящена работе асессоров с языковой классификацией главных страниц сайтов (Landing page).

В главе 4 речь идет о присвоении страницам специальных категорий, исходя из их полезности для пользователей. На сегодняшний день в Google разработано 6 таких категорий: Vital, Useful, Relevant, Slightly Relevant, Off-Topic (Useless), Unratable.

Расскажем о каждой категории подробнее:

Категория Vital – присваивается страницам, когда поисковый запрос пользователя, связанный с ними, может быть многозначным. При этом одно из значений должно быть явно доминантным и превалировать над остальными. Запросы подобного рода часто задаются пользователями в отношении компаний, мест, продуктов, персон, организаций и т.п.

К категории Useful может быть отнесена релевантная страница с большой вероятностью полезности для пользователей, перешедших на нее из результатов поиска по конкретным запросам.

Категория Relevant – присваивается релевантным страницам, которые могут быть полезны для достаточно большого количества пользователей. Ее основное отличие от категории Useful заключается в том, что страница категории Relevant может быть несколько менее свежей или находиться на менее авторитетном ресурсе.

Категория Slightly Relevant (буквально: слабо соответствующая страница) присваивается странице, которая в соответствии с косвенными признаками могла бы быть полезной большинству пользователей и напрямую не связана с поисковым запросом. При этом, все же такие страницы должны присутствовать в выдаче, поскольку отдельные пользователи могут найти на них информацию, соответствующую именно их потребностям.

Категория Off-Topic (Useless) присваивается страницам, нерелевантным большинству поисковых запросов, а значит, и малополезным для пользователей страницам. Заключительная категория

Категория Unratable присваивается страницам, в случаях, если их невозможно оценить. Данный статус присуждается страницам в двух случаях: если страница не загружается или если она при запросе на одном языке (к примеру, на французском) она загружается на другом (к примеру, на итальянском). Важно, что страницы на английском языке не считаются иностранными ни для каких запросов. Также в качестве иноязычных не рассматриваются страницы, содержащие изображение, понятное человеку, говорящему на любом языке; страницы со ссылкой для скачивания любого программного продукта; многоязычные страницы, если на них содержится большой объем информации на языке запроса.

Отдельная инструкция посвящена невозможности загрузки страницы: так, если страница открывается в виде пустого бланка; содержит неработающие коды перенаправления (редиректы); выдает сообщение об ошибке или при ее открытии появляется уведомление о наличии вредоносной программы – асессор должен присвоить ей категорию Unratable.

Глава 5 Руководства посвящена «общим проблемам ранжирования» и «содействию улучшению интернета в целом». В ней даются общие рекомендации асессорам относительно оценки релевантности страницы с точки зрения языка запроса, приводятся дополнительные примеры многозначных запросов. Приводятся примеры интерпретации запросов с точки зрения их соответствия информации, содержащейся на главных страницах различных компаний:

[ >>>> ]

Здесь Google призывает асессров руководствоваться принципом максимальной полезности для пользователя той или иной страницы, а также обращать внимание на даты ее создания и последнего обновления. Более свежий контент следует расценивать как более полезный пользователю.

В главе 6 рассматривается еще один тип меток – это метки, указывающие на спам, «сомнительное содержание» сайта или наличие вредоносных программ.

В Google существует следующая классификация спам-меток:

1. Метка Not Spam устанавливается если страница полностью соответствует всем требованиям к публикации веб-страниц.

2. Метка Maybe Spam применяется если у асессора возникает подозрение в том, что страница является спамной.

3. Метка Spam должна использоваться асессором в том случае, если на странице замечены явные признаки спама.

Еще одна разновидность меток — порно-метки. Асессоры в обязательном порядке должны применять их, если страница содержит какие-либо признаки наличия порнографического содержания. Это могут быть изображения, тексты, видео, рекламные сообщения соответствующего характера. Важно отметить, что данная отметка может иметь региональный характер: так контент, не считающийся порнографическим в одной стране, может быть признан таковым в другой. Это связано с культурно-историческими особенностями отдельных стран.

Классификация меток для порно-контента выглядит следующим образом:

1. Метка Clear Non-Porn Intent присваивается страницам, если пользователь попадает на них по обычным явно не порнографическим, запросам. Кроме того, такой контент автоматически признается Off-Topic (Useless).

2. Метка Possible Porn Intent присваиваются в случаях, когда запрос может иметь как порнографическую, так и не порнографическую интерпретацию. В качестве примера приводятся следующие англоязычные запросы: [girls], [gay], [thong], [breast], [sex], [spanking]. В Google их называют Possible Porn Inten (возможно, порнографические намерения). В таких случаях асессоры должны считать приоритетными непорнографические запросы и рассматривать страницы с «сомнительным содержанием» как порнографические.

3. Метка Clear Porn Intent присваивается откровенно порнографическим страницам, релевантным порно-запросам.

Еще один тип меток касается зараженных страниц. К этому вопросу подходит следующим образом: даже если на странице есть качественный, свежий и релевантный контент, но она содержит вредоносное ПО, следы вируса или трояна – ее позиции в выдаче будут очень низкими.

Исходя из этого правила, Google применяет метку «Malicious». Она присваивается страницам, если на них появляются незакрывающиеся всплывающие окна или, когда открытие страницы повлекло за собой попытку загрузки вредоносной программы. При этом важно знать, что если на странице появилось окно браузера с предупреждением о наличии вредоносного ПО, то статус «Malicious» ей не присваивается рейтинг Unratable — невозможно загрузить страницу.

Во второй части «Общего руководство по оценке качества поиска» приводятся разнообразные задания для асессоров и рассматриваются примеры их решения. В большинстве своем они направлены на оценку URL.

Часть 3 посвящена аспектам ранжирования геозависимых и геонезависимых запросов. Здесь асессорам рекомендуется присваивать более высокие рейтинги как геозависимым, так и геонезависимым запросам, которые могут быть полезны пользователям. При этом, если пользователи ищут определенные места, адреса, объекты наивысшие позиции в результатах выдачи будут получать официальные сайты и страницы этих объектов. В свою очередь, страницы справочников и сайтов с упоминаниями адресов этих организаций будут ранжироваться хуже. Также Руководство советует асессорам придерживаться общего правила: если у специалиста возникает трудность с определением, является ли запрос геозависимым, то страницы, содержащие релевантную информацию нужно ранжировать как по геонезависимому запросу.

В остальных частях Руководства рассматриваются вопросы рекламного контента и поискового спама. Здесь интернет-гигант советует асессорам опираться на рекомендации по обеспечению качества поиска, данные ранее веб-мастерам и разработчикам сайтов.

Google напоминает, что поисковая система строго наказывает за использование:

  1. Автоматически сгенерированного содержания;
  2. Участие в схемах обмена (а также купли/продажи) ссылок;
  3. Маскировок (клоакинга);
  4. Скрытой переадресации;
  5. Скрытого текста и скрытых ссылок;
  6. Дорвеев;
  7. Дублированного содержания;
  8. Участия партнерских программах при полном игнорировании качественного контента на сайте;
  9. «Накачивания» страниц нерелевантными ключевиками;
  10. Создание фишинговых страниц;
  11. Злоупотребление разметкой для создания расширенных описаний страниц в результатах поиска. При этом, нарушением считается, если разметка не видна пользователям, а также, если она не соответствует контенту или вводит пользователей в заблуждение;
  12. Отправки автоматических запросов в Google.

Вместо этого Google рекомендует веб-мастерам тщательно отслеживать все попытки взлома сайта и удаления его содержания. Оперативно удалять спам, созданный пользователями, и не допускать возможности его проникновения на ресурс.

Говоря об отличии спам-страниц от качественных, представители гиганта поиска напоминают: если страница в полной мере соответствует критериям полезности для пользователей и содержит некоторое количество PPC-объявлений, она вполне может быть признана качественной.

Асессорам следует оценивать, удовлетворяет ли страница требованиям полезности для пользователя. Иными словами, присутствует ли на ней:

  1. обмен полезной информацией;
  2. обмен мнениями реальных людей;
  3. возможность публикации вопросов и ответов, отзывов о товаре;
  4. развлекательная составляющая;
  5. возможность обмена медиа-контентом;
  6. возможность обмена пользователей файлами;
  7. наличие контактной информации о продавце и производителе товара;
  8. наличие купонов, скидок, спецпредложений.

Как видно из приведенного материала, руководство Google уделяет все более пристальное внимание работе над качеством собственной поисковой выдачи, привлекая к этому процессу не только огромный штат корпорации, но и асессоров со стороны. Еще одним доказательством данному утверждению является и то, что Google на днях рассказал своим пользователям о том, что происходит между нажатием кнопки «Поиск» и появлением страницы с результатами на специально созданном сайте «Как работает поиск».

Перевод Анастасии Матвеевой

Wolfram alpha для Google Android

Суббота, 9 Март 2013

Wolfram alpha — своеобразная поисковая система в базе данных научных знаний и вычислительных алгоритмов. Основатель компании Wolfram Research, Стивен Вольфрам обосновал возможность перевода текстовых запросов на естественных языках в машинный язык и применил ее на практике в своей поисковой системе.

Таким образом, на ваш запрос поисковик возвращает не перечень ссылок на сайты, возможно содержащие ответ на ваш вопрос или имеющие хоть какое-то отношение к оному, а готовый ответ. Это система искусственного интеллекта, не только осуществляющая поиск, но и вычисляющая ответ на основе огромной естественнонаучной и гуманитарной базы данных.

Система разрабатывается уже четверть века. Стивен Вольфрам, создатель этой системы и языка программирования «Математика», на котором она написана, некогда занимался клеточными автоматами и издал книгу с многообещающим названием «Новый вид Знания», ставшую бестселлером и вызвавшую оживленные дискуссии в научной среде.

Wolfram alpha содержит огромную базу данных по математике, физике, астрономии, биологии, химии, медицине, истории, географии, политике, музыке, кино, а так же известных персонах. Способен конвертировать различные единицы измерения друг в друга, работать с разными системами исчисления, вычислять приближения дробных чисел, суммы, пределы, интегралы, решать уравнения и системы уравнений, оперировать с матрицами, определять свойства чисел и геометрических фигур. Искусственный интеллект, на котором основан Wolfram alpha, поначалу выдавал забавные ошибки, например, признал Аслана Масхадова президентом России в 1999 году.

Сам движок Wolfram alpha представляет собой алгоритм обработки высказываний на естественном языке и переводе его в удобоваримый для машины вид и обратно, а так же гигантской библиотеке алгоритмов. Программа состоит приблизительно из пяти миллионов строк и на данный момент выполняется на десяти тысячах процессоров.

Сам интерфейс программы прост и представляет собой браузер, замороженный на одной странице и расширенную математическими символами клавиатуру. Разумеется, для использования требуется подключение к интернету.

Создание мобильной версии этого головокружительного сервиса изрядно добавило радости студенческому и школьному сообществу, а их преподавателям – головной боли. Обработав запрос на естественном языке, программа не только решит вашу задачу, предоставив результаты, но и сообщит вам весь ход решения.

Подлинная система Искусственного Интеллекта, подобна фантастическому компьютеру звездолета «Энтерпрайз» из сериала «Звездный путь». Кроме знания всего и обо всем, она еще обладает невероятными вычислительными возможностями. Не за горами и распознавание человеческой речи, пока осуществленное только на платформе iOS в рамках проекта Siri.

В Германии ввели «налог на Google»

Суббота, 2 Март 2013

Согласно закону, все поисковые системы и новостные агрегаторы, собирающие и перепечатывающие новости, должны выплачивать авторам компенсацию 

Немецкие законодатели приняли закон, согласно которому все поисковые системы и новостные агрегаторы, собирающие и перепечатывающие новости, должны выплачивать авторам компенсацию, сообщает РБК.

Отметим, что конкретные размеры компенсаций новый документ не предусматривает, также нет определенной системы их расчета, однако закон служит поводом для подачи исковых заявлении в суд.

Когда законопроект находился на стадии обсуждения, корпорация Google выступила с резкой критикой такого нововведения, что стало поводом прозвать закон «налогом на Google». Как отмечают представители компании, подобные законы нарушают все принципы устройства Интернета и системы гиперссылок.

Интернет-пользователи получили возможность просматривать самые быстрорастущие поисковые запросы к Google за определенный день в семи новых странах, включая Россию

Суббота, 2 Март 2013

Интернет-пользователи получили возможность просматривать самые быстрорастущие поисковые запросы к Google за определенный день в семи новых странах, включая Россию, пишет в корпоративном блоге представитель Google Цвика Хартман.

В отличие от годового рейтинга запросов Google Zeitgeist, инструмент «Популярные запросы» сервиса Google Trends позволяет анализировать наиболее интересные для пользователей темы в определенный день. В основу сервиса заложен алгоритм выявления тем, интерес к которым растет быстрее всего за конкретный промежуток времени.

Ежедневная статистика запросов теперь доступна, помимо России, для Австралии, Канады, Гонконга, Израиля, Тайваня и Великобритании. Ранее сервис уже позволял узнать, какие новости или события находятся на пике популярности в определенный период в США, Японии, Индии и Сингапуре.

«Некоторые темы пользуются популярностью практически во всем мире — например, премия „Оскар“ или видео Harlem Shake, но большинство трендов актуальны только для отдельно взятых регионов. Чтобы изучить их, выберите нужную вам страну и при необходимости воспользуйтесь Переводчиком Google», — пишут разработчики.

Google является второй по популярности поисковой системой в России, занимая около 26,5% рынка и уступая «Яндексу».

Во Франции создан интернет-поисковик, который может составить конкуренцию мировому гиганту Google

Суббота, 2 Март 2013

Во Франции запущен интернет-поисковик отечественной разработки, который, как заявляют его создатели, имеет все шансы потеснить мирового гиганта американского происхождения Google. Как сообщили сегодня местные СМИ, его главными преимуществами стали возможность поиска информации в социальных сетях и удобная форма выдачи результатов.

Поисковая система, получившая название Qwant, заработала в тестовом режиме на 15 языках, в том числе, на русском, и доступна пользователям 35 стран мира. Главная страница своим оформлением напоминает стартовые страницы популярных интернет-поисковиков, но после ввода запроса все результаты выдаются в оригинальном формате: картинки, видео, новости, предложения в интернет-магазинах и информация, найденная на прочих интернет-сайтах, публикуется на одной странице. Кроме того, в отличие от существующих поисковых систем, новый ресурс способен находить информацию в социальных сетях Facebook, Twitter и Google+, причем речь идет не только о сообщениях пользователей и размещенных ими фотографиях и видео, но и об оставленных к ним комментариях.

«Мы хотели, чтобы на одной странице были показаны все возможные результаты, имеющие отношение к запросу пользователя», — отметил один из создателей интернет— ресурса, инвестор Жан-Манюэль Розан. По его словам, принцип работы французского поисковика больше соответствует новым реалиям Интернета и учитывает бурное развитие социальных сетей.

Работа над созданием системы Qwant велась в течение двух лет французскими программистами и специалистами в области информационной безопасности. Стратегию развития интернет-ресурса на французском и международном рынке его создатели пока держат в тайне, известно лишь, что доходы проект будет получать от размещения рекламы, как и другие существующие сейчас интернет-поисковики.

На данный момент на долю Google приходится 90 проц французского рынка интернет-поиска, остальные 10 проц делят между собой Bing, Yahoo, Ask Network и Orange Search.

Календарь
Март 2013
Пн Вт Ср Чт Пт Сб Вс
« Фев   Июл »
 123
45678910
11121314151617
18192021222324
25262728293031
Архивы