Filtrado por relevancia semántica: mejora la calidad de búsqueda con embeddings

24. Filtrado por Relevancia Semántica en Búsquedas

This entry is part 24 of 25 in the series Introducción a Microsoft Semantic Kernel

wp-content/uploads/2026/02/ChatGPT-Image-14-feb-2026-20_54_00.png

Introducción a Microsoft Semantic Kernel

Introducción

El filtrado por relevancia semántica mejora la calidad de resultados de búsqueda eliminando matches irrelevantes. En este tutorial aprenderás a implementar filtros inteligentes que combinan similitud vectorial con lógica de negocio.

Conceptos de Relevancia

Tipos de Relevancia

Relevancia Vectorial: Similitud coseno entre embeddings
Relevancia Léxica: Coincidencia de palabras clave
Relevancia de Dominio: Match entre categoría de búsqueda y negocio
Relevancia Contextual: Considerando ubicación, horarios, etc.

Implementación de Filtros

public class SemanticRelevanceFilter
{
    private const double MinVectorScore = 0.35;
    private const double MinLexicalOverlap = 0.2;

    public async Task<List<SearchResult>> FilterRelevantResultsAsync(
        string query,
        List<SearchResult> candidates,
        SearchContext context)
    {
        var queryTokens = TokenizeQuery(query);
        var filtered = new List<SearchResult>();

        foreach (var candidate in candidates)
        {
            var relevanceScore = CalculateRelevance(
                query,
                queryTokens,
                candidate,
                context);

            if (relevanceScore.IsRelevant)
            {
                candidate.RelevanceScore = relevanceScore.Score;
                candidate.RelevanceReason = relevanceScore.Reason;
                filtered.Add(candidate);
            }
        }

        return filtered.OrderByDescending(r => r.RelevanceScore).ToList();
    }

    private RelevanceScore CalculateRelevance(
        string query,
        HashSet<string> queryTokens,
        SearchResult candidate,
        SearchContext context)
    {
        // 1. Vector score check
        if (candidate.VectorScore < MinVectorScore)
        {
            return RelevanceScore.NotRelevant("Vector score too low");
        }

        // 2. Lexical overlap check
        var candidateTokens = TokenizeText(candidate.Description);
        var overlap = CalculateLexicalOverlap(queryTokens, candidateTokens);

        if (overlap < MinLexicalOverlap)
        {
            return RelevanceScore.NotRelevant("Insufficient lexical overlap");
        }

        // 3. Domain match check
        if (context.Domain != null)
        {
            if (!MatchesDomain(candidate, context.Domain))
            {
                return RelevanceScore.NotRelevant("Domain mismatch");
            }
        }

        // Calculate final score
        var finalScore = (candidate.VectorScore * 0.6) + 
                        (overlap * 0.3) + 
                        (DomainBonus(candidate, context) * 0.1);

        return RelevanceScore.Relevant(finalScore, "Passed all checks");
    }
}

Mejores Prácticas

Combinar múltiples señales de relevancia
Ajustar thresholds basándose en métricas de calidad
Logging detallado para debugging
A/B testing de configuraciones

Palabras clave: semantic relevance, filtering, search quality, vector similarity, lexical overlap

Share this content:

24. Filtrado por Relevancia Semántica en Búsquedas

Introducción

Conceptos de Relevancia

Tipos de Relevancia

Implementación de Filtros

Mejores Prácticas

Introducción a Microsoft Semantic Kernel

Relacionado

por David Cantón Nadales

Mis libros

Te has perdido

25. Normalización y Preprocesamiento de Datos para IA

24. Filtrado por Relevancia Semántica en Búsquedas

23. Implementación de Routers Conversacionales Inteligentes

22. Seguridad en Aplicaciones de IA

Introducción

Conceptos de Relevancia

Tipos de Relevancia

Implementación de Filtros

Mejores Prácticas

Introducción a Microsoft Semantic Kernel

Comparte esto:

Relacionado

por David Cantón Nadales

Entradas relacionadas

Te has perdido