代码管理仓库(代码管理仓库有哪些)
admin 发布:2022-12-19 06:13 144
今天给各位分享代码管理仓库的知识,其中也会对代码管理仓库有哪些进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
为何Google、微软、华为将亿级源代码放一个仓库?
作者 | 夕颜
编辑 | Just
出品 | AI 科技 大本营(ID:rgznai100)
大公司应该如何进行代码管理?微软研发并采用 VFS For Git 的过程和这个系统本身有哪些可以借鉴的地方?为了更深入了解 VFS For Git 和代码管理相关问题,AI 科技 大本营(ID:rgznai100)采访了微软亚洲研究院首席研发经理邹欣,他对这些问题进行了解答。
为什么要做 VFS For Git?
邹欣回忆,在将代码迁移到 GVFS 前,微软曾使用多个主要的代码管理平台,包括 SLM, Source Depot (上世纪 90 年代开始)、TFS 的源代码控制 TFVC (2006 年开始)。直到 2017 年,微软用三个月的时间完成代码迁移到 Git,并推出了 Git 的变种,针对特大 repo 的 GVFS,并沿用至今。
GVFS 是一个 Git 虚拟文件系统,全称为 Git Virtual File System,允许 Git 处理 TB 规模的代码库,比如 270 GB 的 Windows 代码库。GVFS 的 V 就是 Virtual(虚拟),它解决了Git 原来的设计缺陷(每个客户端都有所有版本的代码),而是用虚拟文件来代替那些本地用不着的文件, 大大 减少了文件传输和本地机器存储的压力,让微软内部技术人员可以进行高效协作。
一段小插曲是,GVFS 从发布之初就引起了争议,原因是 GNOME 项目的虚拟文件系统也叫 GVfs,而 GNOME 的 GVfs 最早发布于 2006 年,之后的教程、文档、论坛都沿用这个名字。在微软的 GVfs 项目发布后,很快超过了 Gnome GVfs 项目的搜索排名,且由于二者都与虚拟文件系统有关,导致用户在查找信息时容易出现混淆。于是,很多开发者要求微软改名,经过一番周折后,微软终于在 2018 年将 "GVFS" 项目的名字改为 "VFS For Git"。
邹欣表示,当时微软将代码迁移到 Git 主要是为了统一微软百花齐放的内部工具,并没有一个绝对好的选择,领导团队选择了 Git, 但从现在的结果来看,这是一个比较好的选择。如今,微软仍然在对 Git 系列的工具做改进,也把改进回馈到 Git 社区。
现在,VFS For Git 已经是微软内部统一的工具,同时被其他大型企业采用:
VFS For Git 在 GitHub 上也已开源:
GitHub开源地址: .com /microsoft/VFSForGit
除了微软,我们发现,很多大公司的代码托管已经向自己内部开发的版本控制系统迁移,比如 Google 就把使用不同语言编写的超过 10 亿文件,近百 TB 源代码都存放在自行开发的版本管理系统 Piper 中,只当项目开源且需要外部协作时,才会使用业界流行的 Git。(详见文章《为何Google将几十亿行源代码放在一个仓库?》)
再如华为的内源(Inner Source)平台,承载着华为 1100 亿源代码、60 万+ 代码仓库、每天 60 T 的下载容量、1 万次/秒的 高峰 并发下载。
这是否说明在大公司中流行的单一仓库就是最好的做法? 这些公司在选择采用代码托管方式时需要考虑哪些不同的问题?
邹欣解释,在他看来,用 GVFS 也可以创建各种独立的仓库。用一套工具有利于公司内部进行代码共享,让人员流动、代码复审、改进工具变得更简单,效率提高。
其次,大公司有很大量的代码,很长的 历史 和很多工具,如果贸然选择一个新工具就会出现以下问题:
a) 一些市面上的工具并不是为大规模代码设计的,处理不了大量代码, 我们以前用第三方的代码分析工具, 结果处理 Office 的代码的时候,自己崩溃了,因为 Office 的代码量太大,这个工具的开发者没有为如此大的代码设计软件。
b) 很多工具在 历史 中不断演化, 有自己独特的特点,很多和企业内部的某些特殊需求有关,外部工具很难都实现这样的功能。
很多工具联合在一起,会形成了一个工具的生态,但如果只改变一个工具,让其他的工具变得不兼容, 那整个团队的很多工作流就会出现问题。
此外,邹欣表示,代码托管与 AI 结合是未来发展方向。例如,这种结合会告诉你昨天晚上签入代码有问题, 或者签入代码和某个其他团队的代码相似,建议重用。或者告诉你签入的代码是从网上拷贝来的, 而且把原来代码中的 bug 也拷贝过来了。
最后,AI 科技 大本营引用此前微软云开发服务副总裁 Brian Harry 于 2017 年发表的一篇博文内容,在微软推出 VFS For Git 三个月后,他分享了该平台的更多细节及其未来目标,包括扩大开放源代码并改善其在 Microsoft 上的运行表现,想要了解 VFS For Git 更详细的信息,不妨仔细研读一下这篇文章:
每日检出量
.com /bharry/the-largest-git-repo-on-the-planet/
docker快速部署gitlab代码仓库
GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的web服务。
GitLab由乌克兰程序员DmitriyZaporozhets和ValerySizov开发,它使用 Ruby语言 写成。后来,一部分用 Go语言 重写。截止2018年5月,该公司约有290名团队成员,以及2000多名开源贡献者。GitLab被IBM,Sony,JülichResearchCenter,NASA,Alibaba,Invincea,O’ReillyMedia,Leibniz-Rechenzentrum(LRZ),CERN,SpaceX等组织使用。
Git、Github、Gitlab的区别:
• Git
一种代码版本管理系统,可以理解为标准或者统称。
• Github
产品名称,基于git开发的代码管理系统,必须公开于互联网上的公共仓库,安全较低,私有项目需要另外付费。
• Gitlab
产品名称,基于git开发的私有代码管理系统,开源免费、可自行管理的私有仓库,安全较高。
• 其它Git
msysGit、 Gitee(码云)、Gitea、 Gogs、 GitBucket类似于Github、Gitlab
下面我们介绍如何用docker快速部署一套功能强大的gitlab-ce社区版代码仓库。
第一步、centos 7.6安装、配置IP、dns、网关等(略)
第二步、安装docker安装,参考作者前几天的文章《centos 7下安装docker》
第三步、安装docker-compose,参考作者前几天的文章《使用docker-compose运行docker容器》
第四步、下载gitlab-ce 13.12.10官方镜像
docker pull gitlab/gitlab-ce:13.12.10-ce.0
第五步、建立相关目录结构,配置目录权限
mkdir -p /data/gitlab/config
mkdir -p /data/gitlab/data
mkdir -p /data/gitlab/logs
第六步、建立docker-compose.yml
cd /data/gitlab vi docker-compose.yml
docker-compose.yml具体配置和说明放本文章后面。
第七步、使用dc up -d起动容器
cd /data/gitlab dc up -d
等待几分钟后服务初始化完成,使用宿主机IP在浏览器上进入gitlab,配置root管理员的密码。一套功能强大的gitlab代码仓库搭建完成,关于gitlab的具使用,后面会推出相关视频/文章说明。
附:docker-compose.yml
version: '3.6' #配置编排的版本
services:
gitlab:
image: gitlab/gitlab-ce:13.12.10-ce.0
TZ: 'Asia/Shanghai' #配置容器时区,不会有8小时差异
GITLAB_OMNIBUS_CONFIG: |
external_url '' #服务器访问地址,也可以是域名
gitlab_rails['time_zone'] = 'Asia/Shanghai' #配置gitlab服务的时区
gitlab_rails['smtp_address'] = "smtp.exmail.qq.com" #管理员邮箱smtp地址
gitlab_rails['smtp_port'] = 465 #管理员邮箱服务器端口
gitlab_rails['smtp_user_name'] = "chenyk@xxxxxx.com" #管理员邮箱地址
gitlab_rails['smtp_password'] = "ZSfS11AssBXX" #管理员邮箱密码,配置后才可以给用户发邮件等信息
gitlab_rails['smtp_domain'] = "xxxxxx.com" #管理员邮箱域名
gitlab_rails['smtp_authentication'] = "login" #管理员邮箱的验证方式为login
gitlab_rails['smtp_enable_starttls_auto'] = true #使用安全加密方式登陆管理员邮箱
gitlab_rails['smtp_tls'] = true
gitlab_rails['gitlab_email_from'] = 'chenyk@xxxxxx.com' #管理员邮箱账号
gitlab_rails['gitlab_shell_ssh_port'] = 22
ports: #放开gitlab 80端口,后面我们用80端口访问gitlab
- '80:80'
volumes: #挂载配置、数据持久化、日志目录
- ./config:/etc/gitlab
- ./data:/var/opt/gitlab
- ./logs:/var/log/gitlab
代码仓库单向同步会覆盖吗
会。代码仓库单向同步会直接覆盖,且不受保护分支等规则限制,因此同步功能仅允许仓库管理员执行触发。代码仓库是一个公共或私有的保存大量源代码的地方。大多数仓库会用作备份、版本控制,在多人开发的项目中会帮助处理各种代码版本问题。
代码管理-gitlab使用方法建议
对gitlab的使用主要从两个角度去分析,一个是管理员,一个是开发提交者。
1.1 初始配置
浏览器访问 http://服务器IP:11000
第一次访问会默认以root管理员用户登陆,需要输入两遍密码。
登陆后,可以看到,gitlab中主要围绕着以下几个概念进行操作:
group 团队
如果是作为个人使用,那么使用root用户创建project就可以实现上传下载代码了。
如果是小团队项目,就需要创建group,并在group中创建projects,添加user到group中,并给用户相应的权限。
1.1.1 关闭系统注册功能
为了便于管理,可以选择关闭gitlab的注册功能.
在主界面左边条依次选择 **Settings - General - Sign-up restrictions** ,点击 Expand 按钮,在 **Sign-up restrictions** 选项处将勾点掉,下拉点击 **Save changes** 就可以了。
1.1.2 修改网站logo
为了让我们的gitlab看起来更符合项目,可以对网站的logo进行调整,在 **Appearance** 中对 导航条图标(Navigation bar)、网站图标(Favicon)、登陆页图标(Sign in/Sign up pages)进行设置。
1.2 代码管理
1.2.1 团队协作方式
gitlab团队协作主要有两种方式:
使用fork
* 项目负责人在gitlab上新建一个项目,并分享URL给开发人员
* 开发人员在负责人的gitlab项目页面上点击“fork”按钮,将此项目fork到自己的gitlab上,这相当于是从负责人那拷贝了一份项目副本,无论开发人员如何修改代码都不会影响负责人那master分支上的代码
* 然后开发人员可以根据自己的项目分工,像对待普通项目一样做clone、add、commit、push等操作
* 如果开发人员人为一个小模块做好了,可以点击“**New Merge Request**”按钮,向负责人发送代码合并请求,要合并的代码文件也会以列表的形式同时发送给负责人,此时负责人会看到开发人员的请求,经审核如果代码没问题则会合并模块,并向开发人员发送确认合并的通知
不使用fork
1. 负责人为开发人员分别创建开发分支(namedev_branch)
* 项目负责人在gitlab上新建一个项目,并为每一个开发人员创建一个开发分支(namedev_branch)
* 开发人员clone项目之后,经git branch检查发现本地只有master分支,因此也需要把属于自己的开发分支也一起获取下来
`git fetch origin namedev_branch:namedev_branch`
`#拉取远程的一个叫namedev_branch的分支,并在本地创建一个叫namedev_branch的分支和远程的分支匹配`
* 切换到namedev_branch分支
`git checkout namedev_branch`
* 之后的操作如同对待普通项目一样
`git add hello.py`
`git commit -m "add hello.py"`
`git push -u origin namedev_branch #需要注意,是push到远程的namedev_branch分支`
~~这个方式感觉有风险,项目成员要注意自己的branch,很容易因为忽略branch直接向master提交变更,对代码管理会添加麻烦~~
2. 负责人不为开发人员分别创建开发分支 (开发者自己创建)
* 虽然项目负责人不分别为开发人员创建分支,但是需要把他们添加到一个group中,否则开发人员在向项目push自己的开发分支时遇到权限错误
* 开发人员在把项目clone之后需要为自己新建一个开发分支(namedev_branch),因为经由git branch查看发现本地只有master分支
`git branch namedev_branch #新建分支`
`git checkout namedev_branch #切换到开发分支`
`git push origin namedev_branch #将新建的开发分支push到远程项目上`
* 之后的操作如同对待普通项目一样
`git add hello.py`
`git commit -m "add hello.py"`
`git push -u origin namedev_branch #需要注意,是push到远程的namedev_branch分支`
之后,两种方式下项目负责人都可以在项目的gitlab主页上看到每个开发人员的工作进度,并考虑何时merge开发人员的分支到master分支上以完善项目。
所有成员包括项目负责人除克隆、修改、提交代码这些操作外,其它merge、建立分支等操作都在Gitlab网页端进行。
所有分支中,master分支为主干分支,此分支的代码不允许直接修改,只能由其它分支(一般只由develop分支)发出merge请求,经项目管理员代码审查通过后合并代码,普通开发者无权执行push、merge等操作,确保此分支任何时候、任何tag处导出的项目代码都是稳定可正常运行的代码;develop分支为开发分支,可以接受由其它分支发起的merge请求,同样只能经项目管理员代码审查通过后予以合并。
1.2.2 团队初始化
假设我们项目组分为两个组team1、team2,每个组有不同的组员和对应的不同的子项目,对项目组用户开放项目的访问,使用fork方式来做代码的更新和提交。
因此我们的gitlab的架构大概是这样的:
1. 创建Group,在主界面上方的加号选择**New Group**,创建Group只需要填写 Group path 、Group name、Description 几个选项就可以了。Visibility Level选项选择 Private-私有仓库
2. 创建user,对需要加进来的团员,由管理员负责给他们创建相应的用户,创建用户需要填写合法的Email地址,正常情况下会向这个Email发送登陆的初始连接,但是如果不方便的话,也可以在创建后由管理员修改这个user的初始登陆密码。
3. 选中Group添加相应的user,user的角色分以下几种:Guest、Reporter、Developer、Maintainer、owner,基本上我们只会用到guest和developer两种。
4. 在Group中创建project,选中Subgroup,点击 New project 来创建新的项目。
5. 项目完成创建后,相应的团队成员也可以使用fork来获取项目的内容,fork后属于成员自己的项目的git地址是不一样的,这个一定要注意,后面提交代码都是提交到这个fork项目的地址,只有在网页端发起merge request 以及从master更新fork项目时才会用到主项目
1.2.3 代码提交管理
当有新的代码提交请求时,项目负责人可以通过查看merge requests获取到来自fork或者branch的合并请求:
接受合并时,可以选择 Open in Web IDE 来检查审核变更的内容,确认没问题后点击Merge按钮来合并。
1.2.4 活跃度查询
右边条选择 Project - Activity 可以看到push、merge、issue、comment(讨论)等信息
选择 Cycle Analytics 可以看到图形化的分析内容,这部分需要有足够的数据支持,还需要好好研究下。
Cycle Analytics measures the time it takes to go from an idea to production for each project you have.
周期分析功能是监测从每个项目一个想法到产品所需的时间。
## 项目开发方式 issue+milestone+label
如何结合gitlab提供的这些功能来完整的梳理、管理一个产品、或者一个模块的开发方式
定义一个开发任务从开始如何分配到最后如何标识完成的过程。
这一块是用好gitlab的重点,否则就是用gitlab来做一个简单的代替svn的版本管理工具
2.1 fork项目
项目成员首先利用浏览器进入gitlab的系统后,查看自己的group和project,并fork自己需要参与开发的project。
在project的detail界面中点击fork按钮。
fork时会提示选择**Namespace**,这个选择是用来决定这个工程所属的,可以选Users,或者选择Groups,这个会影响到后面工程的url,项目成员都统一选择users本人的命名空间就可以了。
2.2 获取fork项目
项目内容获取主要使用git客户端工具来实现,项目开发人员首先要在本机安装git客户端软件,[下载地址]()
安装时基本都采用默认设置就可以了。
安装完成后我们主要使用Git Bash命令行工具来工作。
2.3 设置账户信息
设置修改本地对应的gitlab用户和邮箱。
2.4 配置ssh连接信息 (windows下没调成功)
1. 创建 SSH密钥
通过下面的命令生成密钥,将命令中的YOUR_EMAIL@YOUREMAIL.COM替换为注册Gitlab时用的Email地址。
`ssh-keygen -t rsa -C "duwj@gitlab.com"`
注意:Enter passphrase (empty for no passphrase) :时,可以直接按两次回车键输入一个空的 passphrase;也可以选择输入一个 passphrase 口令,如果此时你输入了一个passphrase,请牢记,之后每次提交时都需要输入这个口令来确认。
2. 获取公钥内容
SSH密钥生成结束后,根据提示信息找到SSH目录(通常ssh密钥保存路径均为~/.ssh 目录),会看到私钥id_rsa和公钥id_rsa.pub这两个文件,不要把私钥文件id_rsa的信息透露给任何人。
用记事本打开id_rsa.pub,复制里面的所有内容以备下一步使用。
3. 将密钥中的公钥添加到Gitlab
登录Gitlab的web站点,进入个人资料设置 - SSH Keys页面,将第2步所获得的内容粘贴在文本框key内,并填写title以便记忆,而后保存。
2.5 克隆代码
在gitlab网页端进入project的detail中可以下拉看到提示的代码信息。
这样在本地就可以获取到fork的项目内容。
2.6 正常代码更新提交
2.7 更新本地仓库内容命令
2.8 请求合并到master
在网页端进入到project的detail界面后,如果fork的项目代码有变动,在界面右上角会提示**Create merge request** 来提交合并申请
点击创建后,输入本次提交的title和描述,描述要说明本次提交修改的脚本、修改的内容等信息,便于管理员审核。
2.9 【关键】同步最新master库内容
fork后的项目不会自动从master主分支获取更新,需要负责fork的开发人员自己更新版本
如何更新已经fork的代码:
* 首先要先确定一下是否建立了主repo的远程源:
在本地项目库下执行 `git remote -v`
* 如果里面只能看到你自己的两个源(fetch 和 push),那就需要添加主repo的源:
* fetch源分支的新版本到本地
执行 `git fetch upstream`
执行后本地库的内容会更新为与master库一致的内容
* 合并本地两个版本的代码:
执行 `git merge upstream/master`
* 将在本地合并后的代码push到自己的github上去,以更新github上fork的仓库
执行 `git push origin master `
执行后网页端的仓库内容更新为合并后的新版本
对于开发人员来说,会使用fork克隆项目,会使用本地git客户端对项目内容进行更新、编辑、提交,会在网页端提交代码合并申请并且规范编写申请描述就足够了。
对管理人员来说,使用gitlab能方便的知道每个员工负责的内容的提交进度情况,方便对他们提交的代码进行质量的检查走读,还有更多统计类、开发进度管理等等功能,但是需要熟练掌握gitlab上的一些功能使用方法,比如使用issue来管理开发任务分配,使用milestone来制定和管理里程碑等等。
# 3. gitlab使用开发规范
参考:[gitlab使用开发规范]()
代码管理仓库的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于代码管理仓库有哪些、代码管理仓库的信息别忘了在本站进行查找喔。
版权说明:如非注明,本站文章均为 AH站长 原创,转载请注明出处和附带本文链接;
相关推荐
取消回复欢迎 你 发表评论:
- 标签列表
- 最近发表
- 友情链接