Skip to main content

2024 | OriginalPaper | Buchkapitel

Identifying Relevant Data in RDF Sources

verfasst von : Zoé Chevallier, Zoubida Kedad, Béatrice Finance, Frédéric Chaillan

Erschienen in: Research Challenges in Information Science

Verlag: Springer Nature Switzerland

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Abstract

The increasing number of RDF data sources published on the web represents an unprecedented amount of information. However, querying these sources to extract the relevant information for a specific need represented by a target schema is a complex task as the alignment between the target and the source schemas might not be provided or incomplete. This paper presents an approach which aims at automatically populating the classes of a target schema. Our approach relies on a semi-supervised learning algorithm that iteratively identifies instance patterns in the data source that represent candidate instances for the target schema. We present some preliminary experiments showing the effectiveness of our approach.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bogatu, A., Fernandes, A.A.A., Paton, N.W., Konstantinou, N.: Dataset discovery in data lakes. In: 2020 IEEE 36th International Conference on Data Engineering (ICDE), pp. 709–720. IEEE, Dallas, TX, USA, April 2020 Bogatu, A., Fernandes, A.A.A., Paton, N.W., Konstantinou, N.: Dataset discovery in data lakes. In: 2020 IEEE 36th International Conference on Data Engineering (ICDE), pp. 709–720. IEEE, Dallas, TX, USA, April 2020
2.
Zurück zum Zitat Fagin, R., Haas, L.M., Hernández, M., Miller, R.J., Popa, L., Velegrakis, Y.: Clio: schema mapping creation and data exchange. In: Borgida, A.T., Chaudhri, V.K., Giorgini, P., Yu, E.S. (eds.) Conceptual Modeling: Foundations and Applications. LNCS, vol. 5600, pp. 198–236. Springer, Heidelberg (2009). https://doi.org/10.1007/978-3-642-02463-4_12CrossRef Fagin, R., Haas, L.M., Hernández, M., Miller, R.J., Popa, L., Velegrakis, Y.: Clio: schema mapping creation and data exchange. In: Borgida, A.T., Chaudhri, V.K., Giorgini, P., Yu, E.S. (eds.) Conceptual Modeling: Foundations and Applications. LNCS, vol. 5600, pp. 198–236. Springer, Heidelberg (2009). https://​doi.​org/​10.​1007/​978-3-642-02463-4_​12CrossRef
3.
Zurück zum Zitat Fernández, J.D., Martínez-Prieto, M.A., de la Fuente Redondo, P., Gutierrez, C.: Characterising RDF data sets. J. Inf. Sci. 44(2), 203–229 (2018)CrossRef Fernández, J.D., Martínez-Prieto, M.A., de la Fuente Redondo, P., Gutierrez, C.: Characterising RDF data sets. J. Inf. Sci. 44(2), 203–229 (2018)CrossRef
4.
Zurück zum Zitat Jaccard, P.: Distribution de la flore alpine dans le Bassin des Dranses et dans quelques régions voisines (1901) Jaccard, P.: Distribution de la flore alpine dans le Bassin des Dranses et dans quelques régions voisines (1901)
5.
Zurück zum Zitat Koutras, C., et al.: Valentine: evaluating matching techniques for dataset discovery. In: 37th IEEE International Conference on Data Engineering, ICDE 2021, Chania, Greece, 19–22 April 2021, pp. 468–479. IEEE (2021) Koutras, C., et al.: Valentine: evaluating matching techniques for dataset discovery. In: 37th IEEE International Conference on Data Engineering, ICDE 2021, Chania, Greece, 19–22 April 2021, pp. 468–479. IEEE (2021)
6.
Zurück zum Zitat Mazilu, L., Paton, N.W., Fernandes, A.A., Koehler, M.: Schema mapping generation in the wild. Inf. Syst. 104, 101904 (2022)CrossRef Mazilu, L., Paton, N.W., Fernandes, A.A., Koehler, M.: Schema mapping generation in the wild. Inf. Syst. 104, 101904 (2022)CrossRef
7.
Zurück zum Zitat Miller, R.J.: Open data integration. Proc. VLDB Endowment 11(12), 2130–2139 (2018)CrossRef Miller, R.J.: Open data integration. Proc. VLDB Endowment 11(12), 2130–2139 (2018)CrossRef
8.
Zurück zum Zitat Paulheim, H.: Knowledge graph refinement: a survey of approaches and evaluation methods. Semantic Web 8(3), 489–508 (2017)CrossRef Paulheim, H.: Knowledge graph refinement: a survey of approaches and evaluation methods. Semantic Web 8(3), 489–508 (2017)CrossRef
10.
Zurück zum Zitat Sacramento, E.R., Vidal, V.M.P., de Macêdo, J.A.F., Lóscio, B.F., Lopes, F.L.R., Casanova, M.A.: Towards automatic generation of application ontologies. J. Inf. Data Manag. 1(3), 535–550 (2010) Sacramento, E.R., Vidal, V.M.P., de Macêdo, J.A.F., Lóscio, B.F., Lopes, F.L.R., Casanova, M.A.: Towards automatic generation of application ontologies. J. Inf. Data Manag. 1(3), 535–550 (2010)
11.
Zurück zum Zitat Yarowsky, D.: Unsupervised word sense disambiguation rivaling supervised methods. In: Proceedings of the 33rd Annual Meeting on Association for Computational Linguistics, pp. 189–196. Association for Computational Linguistics, Cambridge, Massachusetts (1995) Yarowsky, D.: Unsupervised word sense disambiguation rivaling supervised methods. In: Proceedings of the 33rd Annual Meeting on Association for Computational Linguistics, pp. 189–196. Association for Computational Linguistics, Cambridge, Massachusetts (1995)
Metadaten
Titel
Identifying Relevant Data in RDF Sources
verfasst von
Zoé Chevallier
Zoubida Kedad
Béatrice Finance
Frédéric Chaillan
Copyright-Jahr
2024
DOI
https://doi.org/10.1007/978-3-031-59468-7_11

Premium Partner