Информационные технологии в экономике и управлении

1.4. Поиск информации в Internet

Междусетье (Internet) изначально создавалось как средство доступа к удаленной информации. Каналы связи и сетевые устройсва (коммутаторы, маршрутизаторы, модемы) составляют аппаратную основу связи. Операционные системы и функционирующие на их основе приложения реализуют логическую основу обмена информацией. Обмен реализуется средствами сервисов, таких, как электронная почта, WWW, телеконференции, видеоконференции, FTP. Протоколы, на основе которых эти сервисы функционируют, описывают правила структуризации, обмена, хранения информации. Однако они изначально не были предназначены для организации информационно - поисковых систем (ИПС), охватывающих большие массивы информации. По мере накопления информации на серверах, такая проблема возникла. В настоящее время существуют множество ИПС, ориентированных на поиск в информационных массивах, созданных на основе сервисов FTP, WWW, электронной почты, телеконференций. Каждая из таких систем имеет свои особенности. Существует группа специалистов, которые занимаются профессиональным поиском информации в Internet, используя возможности всех существующих сервисов. Мы рассмотрим ниже особенности организации ИПС, работающих на базе протокола HTTP (сервис WWW) и службы поиска людей и организаций.

1.4.1. Информационно - поисковые системы сервиса WWW

Всю информацию, хранящуюся на Web - серверах мы можем разделить по функциональному назначению на две крупные категории: информация коммерческого, развлекательного характера, новости (каталоги услуг и товаров предприятий разного направления, прогноз погоды, котировки ценных бумаг); аналитическая информация (журнальные публикации, аналитические обзоры и так далее). Доступ пользователей к этим двум типам информации организован по-разному [29,30,31].

Интерфейс пользователя 7 для поиска первого типа информации организован, как тематический каталог. На верхнем уровне иерархии расположены самые общие темы, такие как: "Бизнес и экономика", "Общество и политика", "Наука и образование" и так далее (рис. 9). Общие темы содержат подтемы. Рисунок 9 иллюстрирует часть тематического каталога поискового портала Яndex. При поиске информации вы можете определить регион поиска: Москва, С-Питербург, Россия и так далее. Система также показывает количество доступных ресурсов, то есть сайтов, содержащих информацию нужной тематики. В качестве примера, можно привести крупнейший Российский каталог "Желтые страницы", расположенный по адресу: /. Этот каталог описывает лучшие ресурсы Российской части Internet. Другим крупнейшим Российским каталогом является промышленно-коммерческий справочник "Желтые страницы России" (/index.php?sid=_rbrctr&ssid=&letter=M ). Оба этих справочника издаются также в бумажном варианте. Выходит также периодическое издание - газета "Желтые страницы Internet".

Поиск аналитических материалов удобнее выполнять по сочетаниям слов, которые могут в них содержаться. Для этого интерфейс пользователя включает текстовую строку для набора этих ключевых слов. Результатом поиска является список ресурсов - сайтов, в которых эти слова встречаются с указанием адресов этих сайтов. Откуда система знает, где встречаются набранные нами слова? Рассмотрим подробнее используемые здесь технологии. Для того, чтобы система могла быстро формировать ответ на ваш запрос, одна из ее составных частей, поисковый робот (в зависимости от особенностей функционирования его еще называют пауком, агентом, кроулером) постоянно "путешествует" по сайтам и скачивает их копии в базу данных ИПС. При этом, просматриваются не только страницы сайтов, но и страницы гиперссылок, которые расположены на сайте. В системе выполняется автоматический анализ содержимого сайта: выделяются заголовки, выделяются наиболее часто встречающиеся термины, вычленяется текст, выделенный жирным шрифтом. То есть выполняется работа по определению тематической направленности сайта. Определяется также количество ссылок на сайт, статистика посещаемости, чтобы определить степень его популярности. Конечная задача - построить поисковый индекс, по которому затем можно было бы быстро найти нужный документ. Вид индекса и определяет тип поиска, который затем можно будет производить. Как же строится индекс? В зависимости от используемого в ИПС алгоритма, для всех слов документа сайта или только для выделенных каким-то образом слов, вычисляется частота использования. В результате, каждое слово приобретает "вес". Учитывается также размер шрифта, использование слова в заголовке или ссылке на другой документ. Такая информация о документе и будет составлять его индекс. Внутри ИПС также присутствует словарь слов, содержащий перечень документов, в которых эти слова встречаются.

Часто для слова указаны не все документы, а только те, в которых это слово встречается в заголовке, или встречается наиболее часто. В результате, когда вы пишите в запросе набор слов, ИПС обращается к такому словарю и находит документы, в которых встречаются указанные слова. Именно из этих документов и строится список. Таким образом, полный индекс поисковой системы включает словарь и перечень документов, соответствующих каждому слову словаря. Документы в списке располагаются по релевантности, то есть документы с большей вероятностью соответствия вашему запросу располагаются ближе к началу списка. Как же определяется вероятность соответствия запросу? Она определяется по "весу" запрошенных слов в документе. Если эти слова встречаются в заголовке документа, в ссылке, выделены жирным шрифтом, частота их появления максимальна для данного документа, документ их содержащий будет располагаться в начале списка. Документы в списке сопровождаются адресом их расположения в сети, и, при необходимости, вы скачиваете копию документа с того сервера сети, на котором он расположен.

Среди порталов, выполняющих поиск на русском языке наиболее популярны: Яndех, Rambler, Aport, Google. Их поисковые роботы посещают одни и те же сайты, чтобы отслеживать изменение их состояния с периодичностью от одного раза в месяц до одного раза в три дня .По функциональным возможностям поиска поисковые машины также различаются. Большинство из них может выполнять следующие функции: сортировка (например, может сортировать список найденных документов по дате), выполнение уточняющего поиска в списке найденных документов, выполнение в повторном запросе поиска ресурсов похожих на отмеченные пользователем в результатах первого поиска, организация запроса только в определенном разделе каталога и другие. Вы также можете настроить способ отображения результатов поиска (отображать ли размер документа, его адрес, показывать ли описание документа), настроить структуру поисковой страницы (определить место положения поисковой формы, использовать семейный фильтр, который позволяет отсекать "взрослые" страницы при работе детей с Internet - ресурсами).

7Интерфейс пользователя - Способ взаимодействия программных комплексов с пользователем, реализация сообщений о состоянии системы, запросов на выполнение тех или иных действий.

1.4.2. Службы поиска людей и организаций

Среди большого количества поисковых служб выделяются службы поиска людей и организаций [32, 33]. Основными средствами контакта являются телефон и адрес электронной почты. Службы поиска людей и организаций формируют внутренние базы данных, содержащие эти характеристики для отдельных людей и организаций. Информация для формирования базы выбирается из нескольких источников. Первым из них являются телефонные и адресные справочники, опубликованные в сети. Например, по адресу / расположена база данных Санкт-Петербурга, куда включена база данных жителей этого города и Москвы, карта Санкт-Петербурга, расписание движения транспорта и так далее. Вторым источником информации являются телеконференции. Регистрируясь в той или иной новостной группе, вы сообщаете свой адрес электронной почты и дополнительные реквизиты. Эта информация затем пополняет базы данных поисковых систем. Третьим источником являются страницы на Web-серверах. На большинстве из них указаны фамилии и адреса электронной почты авторов сайтов, авторов публикаций, оформителей сайтов. Четвертым источником является самостоятельная регистрация пользователей сети и организаций в поисковых системах.

Среди англоязычных поисковых систем наиболее популярными являются Fourl l (), WhoWhere? (/ ), BigBook (). Например, последняя представляет собой большой справочник электронных адресов компаний и физических лиц, находящихся в США. В зависимости от разыскиваемой информации, поиск возможен несколькими способами. Метод City Pages показывает карту США с обозначенными штатами, в которой вы при детализации выбираете нужный город и можете узнать о наличии в нем исторических памятников, мест развлечений, гостиничных комплексов и так далее. Этот метод поиска полезен людям, планирующим путешествия. Метод Consumer Guide представляет категории потребительских продуктов. Метод Super Topics является полным тематическим каталогом, охватывающим все области человеческой деятельности. В нем присутствуют темы: "Компьютеры и электроника", "Здоровье и фитнесс", "Бизнес" и так далее. Несколько методов позволяют искать предприятия. Вы можете не знать точного названия предприятия, но знать к какой категории оно относится (например, грузовые перевозки) и штат или город его расположения. Интересной возможностью является поиск с помощью карты. Например, с помощью формы, показанной на рис. 10, вы выбираете штат и категорию бизнеса и используете поиск, основанный на карте. Перед вами появляется карта штата или города и перечень фирм этого направления, как показано на рисунке 11. Выбрав нужную фирму, вы получаете ее электронный адрес, адрес Web сайта, детальную карту ее расположения и так далее. Вы также можете найти предприятия заданной категории, расположенные в пределах определенного вами расстояния от какой-то географической точки. Например, найти китайский буфет не слишком удаленный от вашего места работы. Для поиска людей используется служба People Pages. В простейшем случае вы указываете первое и последнее имя, штат проживания, город. Система также сможет сгенерировать карту, которая покажет, как проехать к человеку, которого вы ищете.

Среди российских поисковых систем отметим службы "Люди в сети" (/people/) и "Электронная Россия" (/ ) (рис. 12). Первый проект функционирует с 1999 года и помогает найти потерянные или измененные электронные адреса людей и организаций. Организаторы предлагают всем желающим зарегистрироваться на сервере. При этом вы должны указать: имя, фамилию, отчество, населенный пункт, организацию, реквизиты, связанные с различными сервисами Internet (e-mail, FIDO8, WWW, ICQ9). В последующем, возможен прямой поиск ваших данных (например, по имени, фамилии, отчеству поиск e-mail), или обратный поиск (по e-mail остальные реквизиты).

Справочник официальных органов Российской Федерации расположен по адресу /wervov/ . В справочнике перечислены должностные лица администрации президента и их телефоны, должностные лица - представители исполнительной власти, полномочные представители президента и так далее.

8FIDO или FIDOnet - международная некоммерческая глобальная компьютерная сеть, которая предоставляет бесплатные услуги электронной почты (NetMail), форумов по интересам (EchoMail) и обмена файлами. Создана сеть в 1984 году. Коммерческая деятельность в ней запрещена. Сеть строится по многоуровневому иерархическому принципу. На самом верхнем уровне находятся географические зоны, в состав зон входят регионы, регионы включают сети, в состав сетей входят узлы, каждый узел предоставляет доступ к сети нескольким пойнтам (point - точка). В результате, адрес пойнта в сети выглядит так: Номер зоны:Номер сети/Номер узла.Номер пойнта. Номер региона включен как первые две цифры в номер сети [135].

9ICQ - один из сервисов Internet для общения в режиме реального времени. Технология была создана компанией ICQ Inc. в 1996 году. Для функционирования необходима клиентская часть приложения, которая находится на вашей рабочей станции, и серверная, которая находится на ICQ - сервере. Каждый пользователь имеет уникальный UIN - номер и пароль. Клиентская часть программы содержит список людей, с которыми вы обмениваетесь сообщениями (контактов). При ее запуске, она соединяется с сервером и сообщает о состоянии контактеров вашего списка контактов в реальном времени. Состояния могут быть: доступен, недоступен, вышел, занят, невидим. Обмен реализуется короткими сообщениями не более 450 символов.

  1. Информационные технологии в экономике и управлении (1)

    Документ
    С начала шестидесятых годов в развитых странах мира начали реализовываться проекты создания компьютерных сетей для отработки технологий надежного обмена информацией между компьютерами и совместного использования сетевых ресурсов.
  2. Общепрофессиональные дисциплины Современная экономическая теория Правоведение Бухучет Информационные технологии в экономике и управлении

    Документ
    законодательные и нормативные правовые акты, регламентирующие производственно-хозяйственную, финансово-экономическую деятельность строительного предприятия; законодательство о налогах и сборах; стандарты бухгалтерского учета; экологическое
  3. Комплекс по дисциплине информационные технологии в экономике

    Документ
    Информационные технологии в экономике и управлении народным хозяйством: Учебно-методический комплекс для аспирантов, обучающихся по специальности 08.00.
  4. Программа дисциплины по кафедре «Экономическая кибернетика» информационные технологии в экономике

    Программа дисциплины
    Программа разработана в соответствии с требованиями государственного образовательного стандарта, предъявляемыми к минимуму содержания дисциплины и в соответствии с примерной программой дисциплины, утвержденной департаментом образовательных
  5. Рабочая программа дисциплина «Информационные технологии в экономике» Специальность (1)

    Рабочая программа
    Дисциплина ОПД.Р.01 "Информационные технологии в экономике" является одной из основных дисциплин регионального (вузовского) компонента блока общепрофессиональных дисциплин Государственного образовательного стандарта высшего
  6. Рабочая программа дисциплина «Информационные технологии в экономике» Специальность (2)

    Рабочая программа
    Дисциплина ОПД.Р.01 "Информационные технологии в экономике" является одной из основных дисциплин регионального (вузовского) компонента блока общепрофессиональных дисциплин Государственного образовательного стандарта высшего
  7. Учебно-методический комплекс по дисциплине Информационные технологии в экономике Спецuальность/направленuе

    Учебно-методический комплекс
    составлен в соответствии с требованиями Государственного образовательного стандарта высшего профессионального образования и на основании примерной учебной программы данной дисциплины в соответствии с государственными требованиями к
  8. Рабочая программа дисциплины ен. Ф. 09 Информационные технологии в экономике (указывается наименование и индекс дисциплины в соответствии с гос и учебным планом специальности)

    Рабочая программа
    Современный этап развития общества характеризуется переходом к всеобщей информатизации, внедрению современных автоматизированных информационных технологий во все сферы экономики.
  9. Учебно-методический комплекс дисциплины ен. Ф информационные технологии в экономике (код и название дисциплины по учебному плану специальности)

    Учебно-методический комплекс
     Информационные системы и технологии в экономике: Учебник / Т. П. Барановская, В. И. Лойко, М. И. Семенов, А. И. Трубилин. - 2-е изд., переработанное и дополненное.

Другие похожие документы..