mirror of
https://github.com/meilisearch/MeiliSearch
synced 2025-01-23 03:37:28 +01:00
Changes to de
This commit is contained in:
parent
28d92c521a
commit
6ad3f57bc1
@ -1,18 +1,36 @@
|
|||||||
use bumpalo::Bump;
|
use bumpalo::Bump;
|
||||||
use serde_json::value::RawValue;
|
use serde_json::value::RawValue;
|
||||||
|
|
||||||
use crate::documents::{validate_document_id_str, DocumentIdExtractionError, PrimaryKey};
|
use crate::documents::{
|
||||||
|
validate_document_id_str, DocumentIdExtractionError, FieldIdMapper, PrimaryKey,
|
||||||
|
};
|
||||||
use crate::fields_ids_map::MutFieldIdMapper;
|
use crate::fields_ids_map::MutFieldIdMapper;
|
||||||
use crate::{FieldId, UserError};
|
use crate::{FieldId, UserError};
|
||||||
|
|
||||||
// visits a document to fill the top level fields of the field id map and retrieve the external document id.
|
// visits a document to fill the top level fields of the field id map and retrieve the external document id.
|
||||||
pub struct DocumentVisitor<'p, 'indexer, Mapper: MutFieldIdMapper> {
|
pub struct FieldAndDocidExtractor<'p, 'indexer, Mapper: MutFieldIdMapper> {
|
||||||
fields_ids_map: &'p mut Mapper,
|
fields_ids_map: &'p mut Mapper,
|
||||||
primary_key: &'p PrimaryKey<'p>,
|
primary_key: &'p PrimaryKey<'p>,
|
||||||
indexer: &'indexer Bump,
|
indexer: &'indexer Bump,
|
||||||
}
|
}
|
||||||
|
|
||||||
impl<'p, 'indexer, Mapper: MutFieldIdMapper> DocumentVisitor<'p, 'indexer, Mapper> {
|
pub struct DocidExtractor<'p, 'indexer, Mapper: FieldIdMapper> {
|
||||||
|
fields_ids_map: &'p Mapper,
|
||||||
|
primary_key: &'p PrimaryKey<'p>,
|
||||||
|
indexer: &'indexer Bump,
|
||||||
|
}
|
||||||
|
|
||||||
|
impl<'p, 'indexer, Mapper: FieldIdMapper> DocidExtractor<'p, 'indexer, Mapper> {
|
||||||
|
pub fn new(
|
||||||
|
fields_ids_map: &'p Mapper,
|
||||||
|
primary_key: &'p PrimaryKey<'p>,
|
||||||
|
indexer: &'indexer Bump,
|
||||||
|
) -> Self {
|
||||||
|
Self { fields_ids_map, primary_key, indexer }
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
impl<'p, 'indexer, Mapper: MutFieldIdMapper> FieldAndDocidExtractor<'p, 'indexer, Mapper> {
|
||||||
pub fn new(
|
pub fn new(
|
||||||
fields_ids_map: &'p mut Mapper,
|
fields_ids_map: &'p mut Mapper,
|
||||||
primary_key: &'p PrimaryKey<'p>,
|
primary_key: &'p PrimaryKey<'p>,
|
||||||
@ -23,9 +41,9 @@ impl<'p, 'indexer, Mapper: MutFieldIdMapper> DocumentVisitor<'p, 'indexer, Mappe
|
|||||||
}
|
}
|
||||||
|
|
||||||
impl<'de, 'p, 'indexer: 'de, Mapper: MutFieldIdMapper> serde::de::Visitor<'de>
|
impl<'de, 'p, 'indexer: 'de, Mapper: MutFieldIdMapper> serde::de::Visitor<'de>
|
||||||
for DocumentVisitor<'p, 'indexer, Mapper>
|
for FieldAndDocidExtractor<'p, 'indexer, Mapper>
|
||||||
{
|
{
|
||||||
type Value = std::result::Result<&'de str, DocumentIdExtractionError>;
|
type Value = std::result::Result<DeOrBumpStr<'de, 'indexer>, DocumentIdExtractionError>;
|
||||||
|
|
||||||
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
||||||
write!(formatter, "a map")
|
write!(formatter, "a map")
|
||||||
@ -37,7 +55,7 @@ impl<'de, 'p, 'indexer: 'de, Mapper: MutFieldIdMapper> serde::de::Visitor<'de>
|
|||||||
{
|
{
|
||||||
let mut docid = None;
|
let mut docid = None;
|
||||||
while let Some((fid, fields_ids_map)) =
|
while let Some((fid, fields_ids_map)) =
|
||||||
map.next_key_seed(FieldIdMapSeed(self.fields_ids_map))?
|
map.next_key_seed(MutFieldIdMapSeed(self.fields_ids_map))?
|
||||||
{
|
{
|
||||||
use serde::de::Deserializer as _;
|
use serde::de::Deserializer as _;
|
||||||
self.fields_ids_map = fields_ids_map;
|
self.fields_ids_map = fields_ids_map;
|
||||||
@ -75,10 +93,83 @@ impl<'de, 'p, 'indexer: 'de, Mapper: MutFieldIdMapper> serde::de::Visitor<'de>
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
struct FieldIdMapSeed<'a, Mapper: MutFieldIdMapper>(&'a mut Mapper);
|
impl<'de, 'p, 'indexer: 'de, Mapper: FieldIdMapper> serde::de::Visitor<'de>
|
||||||
|
for DocidExtractor<'p, 'indexer, Mapper>
|
||||||
|
{
|
||||||
|
type Value = std::result::Result<DeOrBumpStr<'de, 'indexer>, DocumentIdExtractionError>;
|
||||||
|
|
||||||
|
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
||||||
|
write!(formatter, "a map")
|
||||||
|
}
|
||||||
|
|
||||||
|
fn visit_map<A>(self, mut map: A) -> std::result::Result<Self::Value, A::Error>
|
||||||
|
where
|
||||||
|
A: serde::de::MapAccess<'de>,
|
||||||
|
{
|
||||||
|
let mut docid = None;
|
||||||
|
while let Some(fid) = map.next_key_seed(FieldIdMapSeed(self.fields_ids_map))? {
|
||||||
|
use serde::de::Deserializer as _;
|
||||||
|
|
||||||
|
let Some(fid) = fid else {
|
||||||
|
continue;
|
||||||
|
};
|
||||||
|
|
||||||
|
match self.primary_key {
|
||||||
|
PrimaryKey::Flat { name: _, field_id } => {
|
||||||
|
let value: &'de RawValue = map.next_value()?;
|
||||||
|
if fid == *field_id {
|
||||||
|
let value = match value
|
||||||
|
.deserialize_any(DocumentIdVisitor(self.indexer))
|
||||||
|
.map_err(|_err| {
|
||||||
|
DocumentIdExtractionError::InvalidDocumentId(
|
||||||
|
UserError::InvalidDocumentId {
|
||||||
|
document_id: serde_json::to_value(value).unwrap(),
|
||||||
|
},
|
||||||
|
)
|
||||||
|
}) {
|
||||||
|
Ok(Ok(value)) => value,
|
||||||
|
Ok(Err(err)) | Err(err) => return Ok(Err(err)),
|
||||||
|
};
|
||||||
|
if let Some(_previous_value) = docid.replace(value) {
|
||||||
|
return Ok(Err(DocumentIdExtractionError::TooManyDocumentIds(2)));
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
PrimaryKey::Nested { name } => todo!(),
|
||||||
|
}
|
||||||
|
}
|
||||||
|
Ok(match docid {
|
||||||
|
Some(docid) => Ok(docid),
|
||||||
|
None => Err(DocumentIdExtractionError::MissingDocumentId),
|
||||||
|
})
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
pub enum DeOrBumpStr<'de, 'bump: 'de> {
|
||||||
|
De(&'de str),
|
||||||
|
Bump(&'bump str),
|
||||||
|
}
|
||||||
|
|
||||||
|
impl<'de, 'bump: 'de> DeOrBumpStr<'de, 'bump> {
|
||||||
|
pub fn to_bump(&self, bump: &'bump Bump) -> &'bump str {
|
||||||
|
match self {
|
||||||
|
DeOrBumpStr::De(de) => bump.alloc_str(de),
|
||||||
|
DeOrBumpStr::Bump(bump) => *bump,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
pub fn to_de(&self) -> &'de str {
|
||||||
|
match self {
|
||||||
|
DeOrBumpStr::De(de) => *de,
|
||||||
|
DeOrBumpStr::Bump(bump) => *bump,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
struct MutFieldIdMapSeed<'a, Mapper: MutFieldIdMapper>(&'a mut Mapper);
|
||||||
|
|
||||||
impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::DeserializeSeed<'de>
|
impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::DeserializeSeed<'de>
|
||||||
for FieldIdMapSeed<'a, Mapper>
|
for MutFieldIdMapSeed<'a, Mapper>
|
||||||
{
|
{
|
||||||
type Value = (Option<FieldId>, &'a mut Mapper);
|
type Value = (Option<FieldId>, &'a mut Mapper);
|
||||||
|
|
||||||
@ -86,8 +177,10 @@ impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::DeserializeSeed<'de>
|
|||||||
where
|
where
|
||||||
D: serde::Deserializer<'de>,
|
D: serde::Deserializer<'de>,
|
||||||
{
|
{
|
||||||
struct FieldIdMapVisitor<'a, Mapper: MutFieldIdMapper>(&'a mut Mapper);
|
struct MutFieldIdMapVisitor<'a, Mapper: MutFieldIdMapper>(&'a mut Mapper);
|
||||||
impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::Visitor<'de> for FieldIdMapVisitor<'a, Mapper> {
|
impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::Visitor<'de>
|
||||||
|
for MutFieldIdMapVisitor<'a, Mapper>
|
||||||
|
{
|
||||||
type Value = (Option<FieldId>, &'a mut Mapper);
|
type Value = (Option<FieldId>, &'a mut Mapper);
|
||||||
|
|
||||||
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
||||||
@ -107,14 +200,50 @@ impl<'de, 'a, Mapper: MutFieldIdMapper> serde::de::DeserializeSeed<'de>
|
|||||||
Ok((self.0.insert(v), self.0))
|
Ok((self.0.insert(v), self.0))
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
deserializer.deserialize_str(MutFieldIdMapVisitor(self.0))
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
struct FieldIdMapSeed<'a, Mapper: FieldIdMapper>(&'a Mapper);
|
||||||
|
|
||||||
|
impl<'de, 'a, Mapper: FieldIdMapper> serde::de::DeserializeSeed<'de>
|
||||||
|
for FieldIdMapSeed<'a, Mapper>
|
||||||
|
{
|
||||||
|
type Value = Option<FieldId>;
|
||||||
|
|
||||||
|
fn deserialize<D>(self, deserializer: D) -> std::result::Result<Self::Value, D::Error>
|
||||||
|
where
|
||||||
|
D: serde::Deserializer<'de>,
|
||||||
|
{
|
||||||
|
struct FieldIdMapVisitor<'a, Mapper: FieldIdMapper>(&'a Mapper);
|
||||||
|
impl<'de, 'a, Mapper: FieldIdMapper> serde::de::Visitor<'de> for FieldIdMapVisitor<'a, Mapper> {
|
||||||
|
type Value = Option<FieldId>;
|
||||||
|
|
||||||
|
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
||||||
|
write!(formatter, "expecting a string")
|
||||||
|
}
|
||||||
|
fn visit_borrowed_str<E>(self, v: &'de str) -> std::result::Result<Self::Value, E>
|
||||||
|
where
|
||||||
|
E: serde::de::Error,
|
||||||
|
{
|
||||||
|
Ok(self.0.id(v))
|
||||||
|
}
|
||||||
|
|
||||||
|
fn visit_str<E>(self, v: &str) -> std::result::Result<Self::Value, E>
|
||||||
|
where
|
||||||
|
E: serde::de::Error,
|
||||||
|
{
|
||||||
|
Ok(self.0.id(v))
|
||||||
|
}
|
||||||
|
}
|
||||||
deserializer.deserialize_str(FieldIdMapVisitor(self.0))
|
deserializer.deserialize_str(FieldIdMapVisitor(self.0))
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
struct DocumentIdVisitor<'indexer>(&'indexer Bump);
|
pub struct DocumentIdVisitor<'indexer>(pub &'indexer Bump);
|
||||||
|
|
||||||
impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer> {
|
impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer> {
|
||||||
type Value = std::result::Result<&'de str, DocumentIdExtractionError>;
|
type Value = std::result::Result<DeOrBumpStr<'de, 'indexer>, DocumentIdExtractionError>;
|
||||||
|
|
||||||
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
fn expecting(&self, formatter: &mut std::fmt::Formatter) -> std::fmt::Result {
|
||||||
write!(formatter, "an integer or a string")
|
write!(formatter, "an integer or a string")
|
||||||
@ -124,11 +253,13 @@ impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer>
|
|||||||
where
|
where
|
||||||
E: serde::de::Error,
|
E: serde::de::Error,
|
||||||
{
|
{
|
||||||
Ok(validate_document_id_str(v).ok_or_else(|| {
|
Ok(validate_document_id_str(v)
|
||||||
DocumentIdExtractionError::InvalidDocumentId(UserError::InvalidDocumentId {
|
.ok_or_else(|| {
|
||||||
document_id: serde_json::Value::String(v.to_owned()),
|
DocumentIdExtractionError::InvalidDocumentId(UserError::InvalidDocumentId {
|
||||||
|
document_id: serde_json::Value::String(v.to_owned()),
|
||||||
|
})
|
||||||
})
|
})
|
||||||
}))
|
.map(DeOrBumpStr::De))
|
||||||
}
|
}
|
||||||
|
|
||||||
fn visit_str<E>(self, v: &str) -> std::result::Result<Self::Value, E>
|
fn visit_str<E>(self, v: &str) -> std::result::Result<Self::Value, E>
|
||||||
@ -136,7 +267,8 @@ impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer>
|
|||||||
E: serde::de::Error,
|
E: serde::de::Error,
|
||||||
{
|
{
|
||||||
let v = self.0.alloc_str(v);
|
let v = self.0.alloc_str(v);
|
||||||
self.visit_borrowed_str(v)
|
self.visit_borrowed_str(v)?;
|
||||||
|
Ok(Ok(DeOrBumpStr::Bump(v)))
|
||||||
}
|
}
|
||||||
|
|
||||||
fn visit_u64<E>(self, v: u64) -> std::result::Result<Self::Value, E>
|
fn visit_u64<E>(self, v: u64) -> std::result::Result<Self::Value, E>
|
||||||
@ -147,7 +279,7 @@ impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer>
|
|||||||
|
|
||||||
let mut out = bumpalo::collections::String::new_in(self.0);
|
let mut out = bumpalo::collections::String::new_in(self.0);
|
||||||
write!(&mut out, "{v}").unwrap();
|
write!(&mut out, "{v}").unwrap();
|
||||||
Ok(Ok(out.into_bump_str()))
|
Ok(Ok(DeOrBumpStr::Bump(out.into_bump_str())))
|
||||||
}
|
}
|
||||||
|
|
||||||
fn visit_i64<E>(self, v: i64) -> std::result::Result<Self::Value, E>
|
fn visit_i64<E>(self, v: i64) -> std::result::Result<Self::Value, E>
|
||||||
@ -158,6 +290,6 @@ impl<'de, 'indexer: 'de> serde::de::Visitor<'de> for DocumentIdVisitor<'indexer>
|
|||||||
|
|
||||||
let mut out = bumpalo::collections::String::new_in(&self.0);
|
let mut out = bumpalo::collections::String::new_in(&self.0);
|
||||||
write!(&mut out, "{v}");
|
write!(&mut out, "{v}");
|
||||||
Ok(Ok(out.into_bump_str()))
|
Ok(Ok(DeOrBumpStr::Bump(out.into_bump_str())))
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
Loading…
x
Reference in New Issue
Block a user