1. Веб - каталоги

Report
Спецкурс ”Основи Інтернету”
Розділ 3
Пошук в Інтернеті
Спеціальні програмні засоби для пошуку
потрібної інформації в Інтернеті
Різновиди пошуку
1. Веб - каталоги
• Веб-каталог – сайт, на якому
зберігаються впорядковані
за темами посилання на інші
сайти. Список тем, за якими
відсортовано посилання має
ієрархічну структуру (від
загальних тем до підтем –
загальної тематики)
• Веб-каталоги — це один зі
способів організації та
категоризації сайтів. Це
модеровані і тематично
погруповані збірки сайтів.
2. Пошукові машини
Адреси каталогів
Глобальні каталоги
• Каталог Yahoo —
http://dir.yahoo.com
• ODP — http://dmoz.org
Українські каталоги
• http://zikave.at.ua/
• Український розділ ODP
http://dmoz.org/World/Ukrainian/
• MavicaNET
http://www.mavicanet.com/direct
ory/ukr/ — Багатомовний
пошуковий каталог.
Глобальний
каталог Yahoo
http://dir.yahoo.com
Глобальний
каталог ODP
http://dmoz.org
Український
каталог
“Цікава
інформація “
http://zikave.at.ua/
Український
розділ
глобального
каталогу ODP
http://dmoz.org/World/Ukrainian/
MavicaNET—
Багатомовний
пошуковий
каталог.
http://www.mavicanet.com/directory/ukr/
Загальні підходи до пошуку інформації
Правила пошуку інформації
Визначальний фактор
під час отримання з
Інтернету будь-якої
інформації – правильно
обрана стратегія
пошуку.
• Точно формулювати
завдання
• правильно обирати засіб
пошуку
• Чітко визначати початкову
стратегію та критерії
пошуку
Формулювання
запиту
Запит до пошукової
служби має складатися
із загальних слів чи
понять, які найточніше
характеризують мету
пошуку.
Завдання: Дізнатися в
якому році було
написано поему
Шевченка “Гайдамаки”.
Запит: Шевченко Гайдамаки поема
Для отримання більш
точних результатів
доцільно
використову4вати
синоніми, або
альтернативний опис
поставленого
завдання. Потрібна
інформація може
міститися в описі
творчості
письменника.
Запит: Шевченко творчість Гайдамаки
Фактори визначення
якості знайденого
матеріалу
Джерела
наведеної на
сторінці інформації
Частота оновлення
сайту
Якість тексту
Мета, з якою
надають
інформацію
Якість
процитований
джерел
Стратегії пошуку інформації
1. Сформулюйте запит і виконайте пошук. Більшість пошукових
систем запропонують лише ті сторінки, на яких згадано всі слова
запиту, сторінки будуть показані в порядку зменшення релевантності
(значущості)
2. Якщо результат вас не задовольняє, звузьте область пошуку.
Використайте більше уточнювальних слів, або знайдіть слово, яке б
чітко вказувало на шукане поняття.
3. Проаналізуйте результати пошуку. Можливо на одержаних
сторінках є термін або слово, яке також можна використати для
звуження області пошуку.
4. Якщо результат і надалі незадовільний, скористайтесь засобами
розширеного пошуку і сформулюйте складніший критерій.
5. Якщо ж успіху так і не досягнули, спробуйте сформулювати запит
інакше і знову застосуйте наведену методику.
Веб - каталоги
Веб-каталог – сайт, де
зібрано величезну кількість
посилань на інші сайти,
відсортованих і розбитих по
категоріях, залежно від теми
сайту.
Кожний веб-каталог
використовує свою систему
класифікації, але більшість
каталогів також мають
власну систему пошуку за
короткими описами сайтів і
назвами категорій,а не за
вмістом веб-сторінок, як у
пошукових службах.
Завдання: Відшукати інформацію щодо
одержання післядипломної освіти:
Вибираємо веб-каталог (Мета), в реєстрі
сайтів вибираємо Наука і освіта, потім
вибираємо Післядипломна освіта, знаходимо
більш цікаву інформацію.
Найбільший у Всесвітній
павутині веб-каталог Open Directory Project
Каталог відомий як Mozilla
(http://dmoz.org/), містить
посилання більше ніж на 4,5
мільйони сайтів.
Каталог складають добровольці (80
тис. чол.)
Каталог має посилання не лише на
англомовні ресурси, але й на
створені іншими мовами, зокрема
українською.
Сайти в каталозі поділено на 16
категорій, кожна з яких містить
підкатегорії.
В rатегорія World сайти
відсортовано за мовою, якою їх
створено.
Яндекс
Один із найбільших
веб-каталогів
російськомних
ресурсів.
Містить посилання
лише на
російськомовні
сайти.
Пошук здійснюється
в усьому каталозі,
незалежно від того,
яку категорію
відкрито, а для цього
пошуку в поточній
категорії потрібно
встановити
прапорець Только в
этой категории.
http://yaca.yandex.ru
Якщо відкрито категорію
Наука, Навчання, то буде
виведено посилання на
його рубрики, та ще
посилання на освітні
сайти, новини.
Мета
Український веб-каталог Мета, розміщений
за адресою http://meta.ua/reestr.asp, має три
мовні версії :
• українську,
• російську
• англійську.
Зайти на головну сторінку, вибрати Реєстр.
Зверху на сторінці є поле для введення
пошукової інформації. Нижче - каталог.
Тут названо категорії, основні підкатегорії.
Внизу – список посилань навеб-сервіси
порталу:новини, пропозиції роботи, розклад
руху потягів тощо.
Принципи організації та використання пошукових серверів
Веб-каталоги складають за
участю людини. Вони
містять порівняно небагато
інформації (до кількох
мільйонів записів).
Бази даних пошукових
машин генеруються
автоматично і можуть бути
дуже великими – їх обсяг у
найбільших машинах
(Google, Live Search, Yahoo!)
становить кілька мільярдів
записів.
Коли користувач підключається до пошукового сервера, задає критерії пошуку
і переглядає одержані результати, він взаємодіє з пошуковою машиною цього
сервера. Будь-який сайт, що має поле пошуку, можна вважати таким, що має
пошукову машину.
Як влаштовано пошукові сервери
Компоненти пошукової машини:
Агенти (павуки,
кроулери, роботи).
• Програми, які пошукова служба використовує для сканування сайтів
Інтернету з метою пошуку нових і змінених документів, збирання
інформації та її передавання індексувальним програмам.
Індексувальна
програма та індекс
• Коли агент пошукової служби виявляє нову сторінку, він передає
інформацію про неї індексувальній програмі, що сканує документ і
заносить кожне слово до спеціального покажчика, який називається
індексом.
Пошукова машина
• Ця програма знаходить у базі даних інформацію про сторінки, що
відповідають уведеному користувачем критерію. Крім пошуку, вона сортує
знайдені записи так, що найважливіші з них відображаються на початку
списку результатів пошуку.
Веб-інтерфейс
• Використовують для введення критерію пошуку й виведення результатів.
Під веб-інтерфейсом зазвичай розуміють стартову сторінку сайту, де
міститься поле для введення основного критерію пошуку й інших
уточнювальних елементів, а також посилання на тематичні бази даних.
Задання критеріїв розширеного пошуку
Якщо запит складний, варто
скористатися спеціальними
елементами керування, які містяться на
сторінці Розширеного пошуку. За
допомогою полів і розкривних списків
цієї сторінки можна складний критерій.
Кожна пошукова машина має
свій набір параметрів пошуку і власні
способи її введення.
Кілька стандартних можливостей:
• Введення шуканого тексту
• Визначення мови
• Вибір частини сторінки, на якій має
міститися текст(URL сторінки,
заголовок, гіперпосилання)
• Вибір сторінок,створених або
модифікованих упродовж певного
проміжку часу.
• Тип шуканих документів.
Пошукові машини дають змогу
формувати критерії з використанням
логічних операцій “І”, “АБО”, “НЕ”.
Критерії розширеного пошуку
• Пошук у тексту
• Пошук у заголовку
• Пошук із зазначенням
конкретного URL або
доменного імені
• Пошук гіперпосилань
• Пошук з урахуванням мови
• Пошук за датою
• Пошук файлів певного типу
• Логічні операції у критеріях
пошуку
Робота із сторінками результатів
Використання кількох
пошукових серверів
Бази даних пошукових
серверів не ідентичні: через
відмінності в механізмах
збирання й індексування
інформації, через наявність
низки інших факторів кожна
база містить записи,які
відсутні в базах інших
пошукових серверів.
Тому доцільно
виконувати той самий запит
на кількох найбільших
машинах.
Огляд популярних пошукових серверів
Головна сторінка Live Search
Live Search
Яндекс
Google

similar documents