我使用逻辑回归训练了一个分类器模型,它使用一组字符串将字符串分类为0或1。我现在有它,一次只能测试一个字符串。如何让我的模型一次运行多个句子,可能是从.csv文件运行,这样我就不必单独输入每个句子了?
def train_model(分类器,feature_vector_train,label,feature_vector_valid,valid_y,is_neuric_net=false):分类器.fit(feature_vector_train,label)
# predict the labels on validation dataset
predictions = classifier.predict(feature_vector_valid)
if is_neural_net:
predictions = predictions.argmax(axis=-1)
return classifier , metrics.accuracy_score(predictions, valid_y)
那么
model, accuracy = train_model(linear_model.LogisticRegression(), xtrain_count, train_y, xtest_count,test_y)
目前我如何测试我的模型
sent = ['here I copy a string']
将文本转换为字数袋向量
count_vect = CountVectorizer(analyzer='word', token_pattern=r'\w{1,}',ngram_range=(1, 2))
x_feature_vector = count_vect.transform(sent)
pred = model.predict(x_feature_vector)
我得到了这个句子和它的预测
我希望模型能一次对我所有的新句子进行分类,并对每个句子进行分类。
未经允许不得转载!python-如何针对多个字符串测试NLP模型
本文地址:https://ans.52learn.online/2174