分类目录归档:BigData&ML

使用 TF-IDF + TruncatedSVD+ LabelEncoder + LinearSVC 进行多分类文本预测


概述

最近在做一个基于小规模、样本不均衡的文本数据,预测多分类标签的小型项目,最终输出结果虽然不能说是非常让人满意,但考虑到先天条件,已经可以说是大致上过得去,故简单总结一下整体项目的技术路线。

相关模型

1. TF-IDF

参考文档 Sklearn text-feature-extraction

Read more

Django 使用 MySQL 数据库


Django 默认使用 SQLite 数据库,但是显然在实际生产环境中,我们需要更强健的数据库作为支撑。

Django 支持的数据库包括:

  • PostgreSQL
  • MariaDB
  • MySQL
  • Oracle
  • SQLite

通常情况下,我们会采用 MySQL 作为数据库,本文将介绍 Django 使用

Read more