Национално издателство "Аз-буки"
Министерство на образованието и науката
Wikipedia
  • Вход
  • Регистрация
Аз-буки
Няма резултати
Вижте всички резултати
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US
Няма резултати
Вижте всички резултати
Няма резултати
Вижте всички резултати
  • Home
  • Издания
Начало Uncategorized

Предизвикателства при обхождането на интернет с цел извличане на данни

„Аз-буки“ от „Аз-буки“
08-03-2024
в Uncategorized
A A

Георги Чолаков 1), Емил Дойчев 1),
Светла Коева 2)
1)Факултет по математика и информатика – ПУ „Паисий Хилендарски“ (България)
2)Институт за български език „Проф. Любомир Андрейчин“ – БАН (България)

https://doi.org/10.53656/math2024-1-1-cha

Резюме. Статията представя предизвикателствата при реализацията на Система за извличане и визуализация на данни от интернет посредством обхождането на езикови ресурси от хранилището Hugging Face и извличането на данни, свързани с тях. Данните в системата периодично се обновяват, за да се проследява динамиката при създаването на езикови ресурси за различни периоди. Статията представя анализа на достъпните данни, тяхната структура и избрания начин за обхождане на страниците и извличане на данните. Споделеният опит при преодоляването на конкретните предизвикателства може да послужи прирешаването на сходни проблеми, свързани с извличането на данни от интернет, задача, която често стои за разрешаване в различни проекти (включително ученически). Придобитият опит вследствие на описаната разработка показва, че подобен тип системи са силно зависими от имплементацията на обхождания източник на данни и при промяна в неговата структура на данни извличането трябва също да се актуализира, за да продължи да работи.
Ключови думи: уебобхождане; автоматично извличане на данни; набори от езикови данни

 

Влезте в системата, за да прочетете пълната статия Your Image Description

Свързани статии:

Default ThumbnailДвупараметрична задача за оптимално разпределение на ресурси Default ThumbnailИзграждане на позитивни нагласи за предприемачество и социална активност чрез иновативната обучителна система ILS (Innoschool) Default ThumbnailРезултати от външното оценяване по биология и здравно образование – VIII клас (2018/2019 г.) Default ThumbnailИма ли място „Новото изкуство“ в класните стаи? Алтернатива ли е моделът 1:1
Етикети: автоматично извличане на даннинабори от езикови данниуебобхождане

Последвайте ни в социалните мрежи

СподелянеTweet
Предишна статия

Видеопослание за Левски

Следваща статия

An Approach and a Tool for Euclidean Geometry

Следваща статия

An Approach and a Tool for Euclidean Geometry

Релевантни ли са утвърдените таксономии за обучение в електронна среда?

Student Satisfaction with the Quality of a Blended Learning Course

Последни публикации

  • Български проект ще получи финансиране по процедурата за обмен на персонал за 2025 г. от програмата „Мария Склодовска-Кюри“
  • INSAIT очаква кандидати за лятната изследователска програма SURF 2026
  • България и 55. СУ се гордеят с Димитър Кисимов
  • Четенето на глас не трябва да се подценява
  • Майсторски клас: учители споделят модели за повишаване мотивацията на учениците
  • Трима млади учени отиват на Regeneron ISEF
  • Над 1000 ученици откриват ползите от здравословното хранене
  • Непознат клон на живота: 8-метров организъм, живял преди 420 милиона години
  • Специфични диети срещу автоимунни заболявания
  • Преброиха повече водолюбиви птици у нас
  • За смисъла да изучаваш френски език и ползата от обмяната на опит разговаряме с председателя на АПФБ Вяра Любенова
  • „Гугъл“ награди „Инсайт“ с 500 000 долара
  • Глобалното висше образование става все по-многополюсно
  • Практическата работа става водеща в информатиката за VIII и IX клас
  • Домакинството ни на Световното първенство по унивеситетски дебати – кулминация от натрупания опит и успехи
  • Нанси Асенова от НУ „Св. св. Кирил и Методий“ в Тополовград спечели отличието „Млад медиатор“ за 2025 г.
  • Ученици от ОДК – Кюстендил, по следите на Освобождението
  • „Яворови дни“ в Бургас – среща на поезия, памет и младост
  • Дронове влизат в часовете в село Труд
  • Световните вицешампиони по университетски дебати Велина Андонова и Алек Селвелиев: Младите трябва да се интересуват от случващото се
  • Списание „Обучение по природни науки и върхови технологии“ вече е част от европейската база данни ERIH+
  • 5 евро или 5 евра

София 1113, бул. “Цариградско шосе” № 125, бл. 5

+0700 18466

izdatelstvo.mon@azbuki.bg
azbuki@mon.bg

Полезни линкове

  • Къде можете да намерите изданията?
  • Вход за абонати
  • Начало
  • Контакт
  • Абонамент
  • Проекти
  • Реклама

Вестник „Аз-буки”

  • Вестник “Аз-буки”
  • Абонамент
  • Архив

Научните списания

  • Стратегии на образователната и научната политика
  • Български език и литература
  • Педагогика
  • Математика и информатика
  • Обучение по природни науки и върхови технологии
  • Професионално образование
  • История
  • Чуждоезиково обучение
  • Философия

Бюлетин

  • Достъп до обществена информация
  • Условия за ползване
  • Профил на купувача

© 2012-2025 Национално издателство "Аз-буки"

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms bellow to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In
bg_BG
en_US bg_BG
  • Вход
  • Sign Up
Няма резултати
Вижте всички резултати
  • Начало
  • За вестника
  • Екип
  • Архив
    • Вестник “Аз-буки” онлайн издание
  • Контакт
  • Реклама
  • Абонамент
  • en_US

© 2012-2025 Национално издателство "Аз-буки"